-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization
要約 大規模言語モデル (LLM) の急速な進歩は、言語理解と情報処理の向上に合 … 続きを読む
Training on the Test Task Confounds Evaluation and Emergence
要約 私たちは、テスト タスクでのトレーニングと呼ばれる、大規模な言語モデルの評 … 続きを読む
PaliGemma: A versatile 3B VLM for transfer
要約 PaliGemma は、SigLIP-So400m ビジョン エンコーダと … 続きを読む
MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations
要約 豊富なレイアウトとマルチモーダル コンポーネントを含むドキュメントを理解す … 続きを読む
Multi-task Prompt Words Learning for Social Media Content Generation
要約 インターネットの急速な発展は人間の生活を大きく変えました。 人間はソーシャ … 続きを読む
Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison
要約 目覚ましい進歩にもかかわらず、現在の最先端の視覚言語モデル (VLM) は … 続きを読む
Recursive Visual Programming
要約 ビジュアル プログラミング (VP) は、ビジュアル質問応答 (VQA) … 続きを読む
Generative Image as Action Models
要約 画像生成拡散モデルは、画像編集や新しいビュー合成などの新しい機能を利用でき … 続きを読む
LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models
要約 視覚的な命令のチューニングは、大規模マルチモーダル モデル (LMM) の … 続きを読む
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence
要約 大規模言語モデル (LLM) の急速な進歩により、高機能な自律エージェント … 続きを読む
カテゴリー: cs.CL
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence はコメントを受け付けていません