「cs.CL」カテゴリーアーカイブ

What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約言語モデル (LM) という用語は、対象となるモデルの時間固有のコレクショ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

投稿日: 2024年10月16日作成者: jarxiv

要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Hitchhiker’s Guide to Scaling Law Estimation

投稿日: 2024年10月16日作成者: jarxiv

要約スケーリング則は、より少ないパラメーターまたはより小さなトレーニングセッ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約複雑な視覚情報を正確に理解することは、視覚言語モデル (VLM) にとって … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning

投稿日: 2024年10月16日作成者: jarxiv

要約自律エージェントは、複雑な複数ステップの意思決定タスクを自動化する上で大き … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

投稿日: 2024年10月16日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) における幻覚は、実際の応用を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Latent Action Pretraining from Videos

投稿日: 2024年10月16日作成者: jarxiv

要約グランドトゥルースのロボットアクションラベルを使用せずに視覚言語アクション … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation

投稿日: 2024年10月16日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は頻繁に幻覚現象を示しますが … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

投稿日: 2024年10月16日作成者: jarxiv

要約マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification?

投稿日: 2024年10月15日作成者: jarxiv

要約イベント間の時間的関係の自動検出は、主に RoBERTa などのエンコーダ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

A Hitchhiker’s Guide to Scaling Law Estimation

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

Latent Action Pretraining from Videos

MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification?

最近の投稿

最近のコメント

アーカイブ

カテゴリー