「cs.CL」カテゴリーアーカイブ

Efficient Knowledge Editing via Minimal Precomputation

投稿日: 2025年6月5日作成者: jarxiv

要約 Memitのような知識編集方法は、単一の文を使用して事実とその結果を更新す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

投稿日: 2025年6月5日作成者: jarxiv

要約人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

投稿日: 2025年6月5日作成者: jarxiv

要約大規模な視覚言語モデル（LVLMS）は、複数のタスクにわたって印象的な機能 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Multimodal Tabular Reasoning with Privileged Structured Information

投稿日: 2025年6月5日作成者: jarxiv

要約表形式の推論には、表形式データに対するマルチステップ情報抽出と論理的推論が … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos

投稿日: 2025年6月5日作成者: jarxiv

要約ビデオのシーケンシャル構造は、マルチフレームの証拠を見つけてマルチモーダル … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

A Survey on (M)LLM-Based GUI Agents

投稿日: 2025年6月5日作成者: jarxiv

要約グラフィカルユーザーインターフェイス（GUI）エージェントは、ルールベース … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントを受け付けていません

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning

投稿日: 2025年6月5日作成者: jarxiv

要約複雑なテキストタスクにおけるDeepSeek-R1の顕著な推論能力に触発さ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback

投稿日: 2025年6月5日作成者: jarxiv

要約スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

投稿日: 2025年6月5日作成者: jarxiv

要約既存の統一モデルは、視覚言語理解やテキストから画像への生成では高い性能を発 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

On the class of coding optimality of human languages and the origins of Zipf’s law

投稿日: 2025年6月5日作成者: jarxiv

要約ここでは、符号化システムの最適性に関する新しいクラスを提示する。そのクラス … 続きを読む →

カテゴリー: cs.CL, physics.soc-ph | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Efficient Knowledge Editing via Minimal Precomputation

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

Multimodal Tabular Reasoning with Privileged Structured Information

MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos

A Survey on (M)LLM-Based GUI Agents

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning

Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback

UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

On the class of coding optimality of human languages and the origins of Zipf’s law

最近の投稿

最近のコメント

アーカイブ

カテゴリー