cs.CL」カテゴリーアーカイブ

What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models

要約 言語モデル (LM) という用語は、対象となるモデルの時間固有のコレクショ … 続きを読む

カテゴリー: cs.AI, cs.CL | What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models はコメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoRA-Pro: Are Low-Rank Adapters Properly Optimized? はコメントを受け付けていません

A Hitchhiker’s Guide to Scaling Law Estimation

要約 スケーリング則は、より少ないパラメーターまたはより小さなトレーニング セッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Hitchhiker’s Guide to Scaling Law Estimation はコメントを受け付けていません

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

要約 複雑な視覚情報を正確に理解することは、視覚言語モデル (VLM) にとって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models はコメントを受け付けていません

Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning

要約 自律エージェントは、複雑な複数ステップの意思決定タスクを自動化する上で大き … 続きを読む

カテゴリー: cs.CL, cs.CV | Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning はコメントを受け付けていません

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

要約 マルチモーダル大規模言語モデル (MLLM) における幻覚は、実際の応用を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions はコメントを受け付けていません

Latent Action Pretraining from Videos

要約 グランドトゥルースのロボットアクションラベルを使用せずに視覚言語アクション … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | Latent Action Pretraining from Videos はコメントを受け付けていません

MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation

要約 マルチモーダル大規模言語モデル (MLLM) は頻繁に幻覚現象を示しますが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation はコメントを受け付けていません

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

要約 マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models はコメントを受け付けていません

Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification?

要約 イベント間の時間的関係の自動検出は、主に RoBERTa などのエンコーダ … 続きを読む

カテゴリー: cs.AI, cs.CL | Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification? はコメントを受け付けていません