cs.CL」カテゴリーアーカイブ

SubjECTive-QA: Measuring Subjectivity in Earnings Call Transcripts’ QA Through Six-Dimensional Feature Analysis

要約 ファクトチェックは、客観的な不正確さに対処するために、誤った情報や偽情報の … 続きを読む

カテゴリー: cs.AI, cs.CL | SubjECTive-QA: Measuring Subjectivity in Earnings Call Transcripts’ QA Through Six-Dimensional Feature Analysis はコメントを受け付けていません

MuMA-ToM: Multi-modal Multi-Agent Theory of Mind

要約 複雑な現実世界のシナリオで人々の社会的相互作用を理解することは、しばしば複 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | MuMA-ToM: Multi-modal Multi-Agent Theory of Mind はコメントを受け付けていません

Video-MMMU: Evaluating Knowledge Acquisition from Multi-Discipline Professional Videos

要約 人間は、情報の知覚、知識の理解、新しい問題を解決するために知識を適応させる … 続きを読む

カテゴリー: cs.CL, cs.CV | Video-MMMU: Evaluating Knowledge Acquisition from Multi-Discipline Professional Videos はコメントを受け付けていません

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

要約 グラフィカル ユーザー インターフェイス (GUI) アクションのグラウン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration はコメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Temporal Preference Optimization for Long-Form Video Understanding はコメントを受け付けていません

IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models

要約 拡散モデルの急速な発展により、テキストからイメージ(T2I)モデルは大きな … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models はコメントを受け付けていません

Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step

要約 思考連鎖 (CoT) 推論は、複雑な理解タスクに取り組むために、大規模なモ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step はコメントを受け付けていません

CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation

要約 大規模言語モデル (LLM) は、自然言語処理タスクにおいて大きな可能性を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation はコメントを受け付けていません

Reasoning Language Models: A Blueprint

要約 OpenaiのO1およびO3、DeepSeek-V3、AlibabaのQW … 続きを読む

カテゴリー: cs.AI, cs.CL | Reasoning Language Models: A Blueprint はコメントを受け付けていません

Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine

要約 近年、大規模な言語モデル(LLM)は、臨床シナリオで顕著な能力を示していま … 続きを読む

カテゴリー: cs.CL | Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine はコメントを受け付けていません