「cs.CL」カテゴリーアーカイブ

Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization

投稿日: 2024年7月11日作成者: jarxiv

要約大規模言語モデル (LLM) の急速な進歩は、言語理解と情報処理の向上に合 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Training on the Test Task Confounds Evaluation and Emergence

投稿日: 2024年7月11日作成者: jarxiv

要約私たちは、テストタスクでのトレーニングと呼ばれる、大規模な言語モデルの評 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

PaliGemma: A versatile 3B VLM for transfer

投稿日: 2024年7月11日作成者: jarxiv

要約 PaliGemma は、SigLIP-So400m ビジョンエンコーダと … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations

投稿日: 2024年7月11日作成者: jarxiv

要約豊富なレイアウトとマルチモーダルコンポーネントを含むドキュメントを理解す … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Multi-task Prompt Words Learning for Social Media Content Generation

投稿日: 2024年7月11日作成者: jarxiv

要約インターネットの急速な発展は人間の生活を大きく変えました。人間はソーシャ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison

投稿日: 2024年7月11日作成者: jarxiv

要約目覚ましい進歩にもかかわらず、現在の最先端の視覚言語モデル (VLM) は … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Recursive Visual Programming

投稿日: 2024年7月11日作成者: jarxiv

要約ビジュアルプログラミング (VP) は、ビジュアル質問応答 (VQA) … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Generative Image as Action Models

投稿日: 2024年7月11日作成者: jarxiv

要約画像生成拡散モデルは、画像編集や新しいビュー合成などの新しい機能を利用でき … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

投稿日: 2024年7月11日作成者: jarxiv

要約視覚的な命令のチューニングは、大規模マルチモーダルモデル (LMM) の … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

投稿日: 2024年7月11日作成者: jarxiv

要約大規模言語モデル (LLM) の急速な進歩により、高機能な自律エージェント … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization

Training on the Test Task Confounds Evaluation and Emergence

PaliGemma: A versatile 3B VLM for transfer

MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations

Multi-task Prompt Words Learning for Social Media Content Generation

Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison

Recursive Visual Programming

Generative Image as Action Models

LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

最近の投稿

最近のコメント

アーカイブ

カテゴリー