月別アーカイブ: 2024年7月

LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

要約 視覚的な命令のチューニングは、大規模マルチモーダル モデル (LMM) の … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models はコメントを受け付けていません

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

要約 大規模言語モデル (LLM) の急速な進歩により、高機能な自律エージェント … 続きを読む

カテゴリー: cs.CL | Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence はコメントを受け付けていません

Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model

要約 現在の大規模マルチモーダル モデル (LMM) のほとんどは、すでに自然の … 続きを読む

カテゴリー: cs.CV | Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model はコメントを受け付けていません

3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes

要約 3D ガウス スプラッティングなどの粒子ベースの放射フィールド表現は、複雑 … 続きを読む

カテゴリー: cs.CV, cs.GR | 3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes はコメントを受け付けていません

Real-time Holistic Robot Pose Estimation with Unknown States

要約 RGB 画像からロボットのポーズを推定することは、コンピューター ビジョン … 続きを読む

カテゴリー: cs.CV, cs.RO | Real-time Holistic Robot Pose Estimation with Unknown States はコメントを受け付けていません

Chain-of-Dictionary Prompting Elicits Translation in Large Language Models

要約 大規模言語モデル (LLM) は、並列データなしでトレーニングした場合でも … 続きを読む

カテゴリー: cs.CL | Chain-of-Dictionary Prompting Elicits Translation in Large Language Models はコメントを受け付けていません

CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement

要約 低照度画像強化 (LLIE) は、電話写真の需要の急増に伴って進歩してきま … 続きを読む

カテゴリー: cs.CV, eess.IV | CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement はコメントを受け付けていません

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

要約 ドメイン固有のアプリケーションでは、正確なプロンプトまたは検索拡張生成 ( … 続きを読む

カテゴリー: cs.AI | PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods はコメントを受け付けていません

OneRestore: A Universal Restoration Framework for Composite Degradation

要約 現実世界のシナリオでは、画像障害は複合的な劣化として現れることが多く、低照 … 続きを読む

カテゴリー: cs.CV | OneRestore: A Universal Restoration Framework for Composite Degradation はコメントを受け付けていません

Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation

要約 自動運転の進展に伴い、動作計画やナビゲーション時の安全確保がますます重要に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation はコメントを受け付けていません