cs.CL」カテゴリーアーカイブ

Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization

要約 大規模言語モデル (LLM) の急速な進歩は、言語理解と情報処理の向上に合 … 続きを読む

カテゴリー: cs.AI, cs.CL | Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization はコメントを受け付けていません

Training on the Test Task Confounds Evaluation and Emergence

要約 私たちは、テスト タスクでのトレーニングと呼ばれる、大規模な言語モデルの評 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Training on the Test Task Confounds Evaluation and Emergence はコメントを受け付けていません

PaliGemma: A versatile 3B VLM for transfer

要約 PaliGemma は、SigLIP-So400m ビジョン エンコーダと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | PaliGemma: A versatile 3B VLM for transfer はコメントを受け付けていません

MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations

要約 豊富なレイアウトとマルチモーダル コンポーネントを含むドキュメントを理解す … 続きを読む

カテゴリー: cs.CL, cs.CV | MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations はコメントを受け付けていません

Multi-task Prompt Words Learning for Social Media Content Generation

要約 インターネットの急速な発展は人間の生活を大きく変えました。 人間はソーシャ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Multi-task Prompt Words Learning for Social Media Content Generation はコメントを受け付けていません

Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison

要約 目覚ましい進歩にもかかわらず、現在の最先端の視覚言語モデル (VLM) は … 続きを読む

カテゴリー: cs.CL, cs.CV | Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison はコメントを受け付けていません

Recursive Visual Programming

要約 ビジュアル プログラミング (VP) は、ビジュアル質問応答 (VQA) … 続きを読む

カテゴリー: cs.CL, cs.CV | Recursive Visual Programming はコメントを受け付けていません

Generative Image as Action Models

要約 画像生成拡散モデルは、画像編集や新しいビュー合成などの新しい機能を利用でき … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Generative Image as Action Models はコメントを受け付けていません

LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

要約 視覚的な命令のチューニングは、大規模マルチモーダル モデル (LMM) の … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models はコメントを受け付けていません

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

要約 大規模言語モデル (LLM) の急速な進歩により、高機能な自律エージェント … 続きを読む

カテゴリー: cs.CL | Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence はコメントを受け付けていません