投稿者「jarxiv」のアーカイブ

VLDBench Evaluating Multimodal Disinformation with Regulatory Alignment

投稿日: 2025年6月2日作成者: jarxiv

要約 AIツールが合成コンテンツを簡単に生成し、広めることができるため、操作され … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

How much do language models memorize?

投稿日: 2025年6月2日作成者: jarxiv

要約データポイントについてモデルがどれだけ「知っている」かを推定するための新し … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks

投稿日: 2025年6月2日作成者: jarxiv

要約クロスリンガル転送により、モデルはトレーニング中に見えない言語のタスクを実 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning

投稿日: 2025年6月2日作成者: jarxiv

要約トレーニングデータの混合物は、大規模な言語モデルの一般化パフォーマンスに大 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Boosting Multimodal Reasoning with Automated Structured Thinking

投稿日: 2025年6月2日作成者: jarxiv

要約マルチモーダルの大手言語モデルは、多様なドメイン全体に優れていますが、複雑 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs

投稿日: 2025年6月2日作成者: jarxiv

要約 LLMSの信頼性における重要な要素は信頼性の高い不確実性コミュニケーション … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Beyond Multiple Choice: Evaluating Steering Vectors for Adaptive Free-Form Summarization

投稿日: 2025年6月2日作成者: jarxiv

要約ステアリングベクターは、推論時間に言語モデルのアクティベーションに学習バイ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

投稿日: 2025年6月2日作成者: jarxiv

要約このペーパーでは、テスト時に大きな推論モデル（LRMS）の推論の進捗状況を … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LEMMA: Learning from Errors for MatheMatical Advancement in LLMs

投稿日: 2025年6月2日作成者: jarxiv

要約大規模な言語モデル（LLM）は、数学的問題を解決する際に顕著な推論能力を示 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Controllable Context Sensitivity and the Knob Behind It

投稿日: 2025年6月2日作成者: jarxiv

要約予測を行うとき、言語モデルは、そのコンテキストと事前の知識にどれだけ依存し … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

VLDBench Evaluating Multimodal Disinformation with Regulatory Alignment

How much do language models memorize?

Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks

Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning

Boosting Multimodal Reasoning with Automated Structured Thinking

MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs

Beyond Multiple Choice: Evaluating Steering Vectors for Adaptive Free-Form Summarization

AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

LEMMA: Learning from Errors for MatheMatical Advancement in LLMs

Controllable Context Sensitivity and the Knob Behind It

最近の投稿

最近のコメント

アーカイブ

カテゴリー