cs.CL」カテゴリーアーカイブ

Efficient Knowledge Editing via Minimal Precomputation

要約 Memitのような知識編集方法は、単一の文を使用して事実とその結果を更新す … 続きを読む

カテゴリー: cs.AI, cs.CL | Efficient Knowledge Editing via Minimal Precomputation はコメントを受け付けていません

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む

カテゴリー: cs.CL, cs.CV | Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era はコメントを受け付けていません

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

要約 大規模な視覚言語モデル(LVLMS)は、複数のタスクにわたって印象的な機能 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization はコメントを受け付けていません

Multimodal Tabular Reasoning with Privileged Structured Information

要約 表形式の推論には、表形式データに対するマルチステップ情報抽出と論理的推論が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Multimodal Tabular Reasoning with Privileged Structured Information はコメントを受け付けていません

MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos

要約 ビデオのシーケンシャル構造は、マルチフレームの証拠を見つけてマルチモーダル … 続きを読む

カテゴリー: cs.CL, cs.CV | MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos はコメントを受け付けていません

A Survey on (M)LLM-Based GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ルールベース … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | A Survey on (M)LLM-Based GUI Agents はコメントを受け付けていません

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning

要約 複雑なテキストタスクにおけるDeepSeek-R1の顕著な推論能力に触発さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning はコメントを受け付けていません

Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback

要約 スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む

カテゴリー: cs.AI, cs.CL | Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback はコメントを受け付けていません

UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

要約 既存の統一モデルは、視覚言語理解やテキストから画像への生成では高い性能を発 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation はコメントを受け付けていません

On the class of coding optimality of human languages and the origins of Zipf’s law

要約 ここでは、符号化システムの最適性に関する新しいクラスを提示する。そのクラス … 続きを読む

カテゴリー: cs.CL, physics.soc-ph | On the class of coding optimality of human languages and the origins of Zipf’s law はコメントを受け付けていません