cs.CL」カテゴリーアーカイブ

Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks

要約 深い推論は、特に順次のマルチモーダル理解を必要とする視覚中心のシナリオで、 … 続きを読む

カテゴリー: cs.CL, cs.CV | Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks はコメントを受け付けていません

Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents

要約 Captchasは、実際のアプリケーションにWebエージェントを展開するた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents はコメントを受け付けていません

Automatic classification of stop realisation with wav2vec2.0

要約 現代の音声研究は、音声データの注釈のために自動ツールを定期的に使用していま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Automatic classification of stop realisation with wav2vec2.0 はコメントを受け付けていません

Fast Large Language Model Collaborative Decoding via Speculation

要約 大規模な言語モデル(LLM)コラボレーションデコード手法は、各世代のステッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Fast Large Language Model Collaborative Decoding via Speculation はコメントを受け付けていません

Probability-Consistent Preference Optimization for Enhanced LLM Reasoning

要約 優先最適化の最近の進歩は、大規模な言語モデル(LLM)の数学的推論能力を改 … 続きを読む

カテゴリー: cs.CL | Probability-Consistent Preference Optimization for Enhanced LLM Reasoning はコメントを受け付けていません

Translation in the Wild

要約 大規模な言語モデル(LLM)は、とりわけ翻訳に優れており、ゼロおよび少数の … 続きを読む

カテゴリー: cs.CL | Translation in the Wild はコメントを受け付けていません

Enhancing Automated Interpretability with Output-Centric Feature Descriptions

要約 自動化された解釈可能性パイプラインは、植物や文の最初の単語など、大規模な言 … 続きを読む

カテゴリー: cs.CL | Enhancing Automated Interpretability with Output-Centric Feature Descriptions はコメントを受け付けていません

Understanding Refusal in Language Models with Sparse Autoencoders

要約 拒否は、整合した言語モデルの重要な安全行動ですが、拒否を促進する内部メカニ … 続きを読む

カテゴリー: cs.CL | Understanding Refusal in Language Models with Sparse Autoencoders はコメントを受け付けていません

LEXam: Benchmarking Legal Reasoning on 340 Law Exams

要約 テスト時間スケーリングの最近の進歩にもかかわらず、長い形式の法的推論は依然 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2 | LEXam: Benchmarking Legal Reasoning on 340 Law Exams はコメントを受け付けていません

Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models

要約 強化学習(RL)を使用して効果的に大規模な言語モデルの推論能力を強化するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models はコメントを受け付けていません