月別アーカイブ: 2025年3月

Re-evaluating Theory of Mind evaluation in large language models

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）が心の理論（TOM）を持っているかどうかという … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation

投稿日: 2025年3月3日作成者: jarxiv

要約臨床コホートの定義は、患者の募集と観察研究にとって重要ですが、包含/除外基 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning diverse attacks on large language models for robust red-teaming and safety tuning

投稿日: 2025年3月3日作成者: jarxiv

要約有害な応答を引き出すレッドチーム、または識別プロンプトは、大規模な言語モデ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

投稿日: 2025年3月3日作成者: jarxiv

要約環境、社会、およびガバナンス（ESG）の要因を企業の意思決定に統合すること … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.CL, cs.CY, cs.IR | コメントを受け付けていません

Are All Spanish Doctors Male? Evaluating Gender Bias in German Machine Translation

投稿日: 2025年3月3日作成者: jarxiv

要約ドイツの機械翻訳（MT）システムでの職業上のステレオタイプ化と過小評価を評 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は大規模な規模のコーパスで事前に処理されるため … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

投稿日: 2025年3月3日作成者: jarxiv

要約ソーシャルメディアの指数関数的な成長は、デジタル時代の前例を超える情報の作 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、多様なタスク全体で並外れたパフォーマンス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、研究と社会のさまざまな分野を進める上で重要 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLMS）の増え続けるサイズは、計算とメモリの重い要件 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2025年3月

Re-evaluating Theory of Mind evaluation in large language models

Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation

Learning diverse attacks on large language models for robust red-teaming and safety tuning

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

Are All Spanish Doctors Male? Evaluating Gender Bias in German Machine Translation

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー