月別アーカイブ: 2025年3月

Re-evaluating Theory of Mind evaluation in large language models

要約 大規模な言語モデル(LLM)が心の理論(TOM)を持っているかどうかという … 続きを読む

カテゴリー: cs.AI, cs.CL | Re-evaluating Theory of Mind evaluation in large language models はコメントを受け付けていません

Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation

要約 臨床コホートの定義は、患者の募集と観察研究にとって重要ですが、包含/除外基 … 続きを読む

カテゴリー: cs.CL | Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation はコメントを受け付けていません

Learning diverse attacks on large language models for robust red-teaming and safety tuning

要約 有害な応答を引き出すレッドチーム、または識別プロンプトは、大規模な言語モデ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Learning diverse attacks on large language models for robust red-teaming and safety tuning はコメントを受け付けていません

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

要約 環境、社会、およびガバナンス(ESG)の要因を企業の意思決定に統合すること … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CL, cs.CY, cs.IR | Optimizing Large Language Models for ESG Activity Detection in Financial Texts はコメントを受け付けていません

Are All Spanish Doctors Male? Evaluating Gender Bias in German Machine Translation

要約 ドイツの機械翻訳(MT)システムでの職業上のステレオタイプ化と過小評価を評 … 続きを読む

カテゴリー: cs.CL | Are All Spanish Doctors Male? Evaluating Gender Bias in German Machine Translation はコメントを受け付けていません

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

要約 大規模な言語モデル(LLM)は大規模な規模のコーパスで事前に処理されるため … 続きを読む

カテゴリー: cs.AI, cs.CL | AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models はコメントを受け付けていません

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

要約 ソーシャルメディアの指数関数的な成長は、デジタル時代の前例を超える情報の作 … 続きを読む

カテゴリー: cs.AI, cs.CL | GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse はコメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

要約 大規模な言語モデル(LLMS)は、多様なタスク全体で並外れたパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training はコメントを受け付けていません

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

要約 大規模な言語モデル(LLM)は、研究と社会のさまざまな分野を進める上で重要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery はコメントを受け付けていません

You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning

要約 大規模な言語モデル(LLMS)の増え続けるサイズは、計算とメモリの重い要件 … 続きを読む

カテゴリー: cs.CL | You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning はコメントを受け付けていません