投稿者「jarxiv」のアーカイブ

VLDBench Evaluating Multimodal Disinformation with Regulatory Alignment

要約 AIツールが合成コンテンツを簡単に生成し、広めることができるため、操作され … 続きを読む

カテゴリー: cs.CL | VLDBench Evaluating Multimodal Disinformation with Regulatory Alignment はコメントを受け付けていません

How much do language models memorize?

要約 データポイントについてモデルがどれだけ「知っている」かを推定するための新し … 続きを読む

カテゴリー: cs.CL | How much do language models memorize? はコメントを受け付けていません

Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks

要約 クロスリンガル転送により、モデルはトレーニング中に見えない言語のタスクを実 … 続きを読む

カテゴリー: cs.CL | Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks はコメントを受け付けていません

Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning

要約 トレーニングデータの混合物は、大規模な言語モデルの一般化パフォーマンスに大 … 続きを読む

カテゴリー: cs.CL, cs.LG | Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning はコメントを受け付けていません

Boosting Multimodal Reasoning with Automated Structured Thinking

要約 マルチモーダルの大手言語モデルは、多様なドメイン全体に優れていますが、複雑 … 続きを読む

カテゴリー: cs.CL | Boosting Multimodal Reasoning with Automated Structured Thinking はコメントを受け付けていません

MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs

要約 LLMSの信頼性における重要な要素は信頼性の高い不確実性コミュニケーション … 続きを読む

カテゴリー: cs.CL, cs.LG | MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs はコメントを受け付けていません

Beyond Multiple Choice: Evaluating Steering Vectors for Adaptive Free-Form Summarization

要約 ステアリングベクターは、推論時間に言語モデルのアクティベーションに学習バイ … 続きを読む

カテゴリー: cs.CL, cs.LG | Beyond Multiple Choice: Evaluating Steering Vectors for Adaptive Free-Form Summarization はコメントを受け付けていません

AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

要約 このペーパーでは、テスト時に大きな推論モデル(LRMS)の推論の進捗状況を … 続きを読む

カテゴリー: cs.CL | AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time はコメントを受け付けていません

LEMMA: Learning from Errors for MatheMatical Advancement in LLMs

要約 大規模な言語モデル(LLM)は、数学的問題を解決する際に顕著な推論能力を示 … 続きを読む

カテゴリー: cs.AI, cs.LG | LEMMA: Learning from Errors for MatheMatical Advancement in LLMs はコメントを受け付けていません

Controllable Context Sensitivity and the Knob Behind It

要約 予測を行うとき、言語モデルは、そのコンテキストと事前の知識にどれだけ依存し … 続きを読む

カテゴリー: cs.AI, cs.CL | Controllable Context Sensitivity and the Knob Behind It はコメントを受け付けていません