cs.CL」カテゴリーアーカイブ

Does Thinking More always Help? Understanding Test-Time Scaling in Reasoning Models

要約 推論モデルのテスト時間スケーリングの最近の傾向(例:Openai O1、D … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Efficient Knowledge Editing via Minimal Precomputation

要約 Memitのような知識編集方法は、単一の文を使用して事実とその結果を更新す … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

要約 大規模な視覚言語モデル(LVLMS)は、複数のタスクにわたって印象的な機能 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Multimodal Tabular Reasoning with Privileged Structured Information

要約 表形式の推論には、表形式データに対するマルチステップ情報抽出と論理的推論が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos

要約 ビデオのシーケンシャル構造は、マルチフレームの証拠を見つけてマルチモーダル … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

A Survey on (M)LLM-Based GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ルールベース … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントする

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning

要約 複雑なテキストタスクにおけるDeepSeek-R1の顕著な推論能力に触発さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback

要約 スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

要約 既存の統一モデルは、視覚言語理解やテキストから画像への生成では高い性能を発 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする