cs.AI」カテゴリーアーカイブ

IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic

要約 インテリジェント車両システムでは、安全で効率的なナビゲーションのために、道 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic はコメントを受け付けていません

Visual Delta Generator with Large Multi-modal Models for Semi-supervised Composed Image Retrieval

要約 合成画像取得 (CIR) は、提供されたテキストの変更に基づいて、クエリに … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Delta Generator with Large Multi-modal Models for Semi-supervised Composed Image Retrieval はコメントを受け付けていません

BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis

要約 本稿では、ラージビジョン言語モデルとマルチエージェントシステムを組み合わせ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.MA | BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis はコメントを受け付けていません

Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural Representation

要約 Implicit Neural Representation (INR) … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.LG | Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural Representation はコメントを受け付けていません

Guided AbsoluteGrad: Magnitude of Gradients Matters to Explanation’s Localization and Saliency

要約 この論文では、顕著性マップの説明のために、Guided AbsoluteG … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | Guided AbsoluteGrad: Magnitude of Gradients Matters to Explanation’s Localization and Saliency はコメントを受け付けていません

ImplicitAVE: An Open-Source Dataset and Multimodal LLMs Benchmark for Implicit Attribute Value Extraction

要約 属性値抽出 (AVE) 用の既存のデータセットは、主に明示的な属性値に焦点 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | ImplicitAVE: An Open-Source Dataset and Multimodal LLMs Benchmark for Implicit Attribute Value Extraction はコメントを受け付けていません

Integrating Disambiguation and User Preferences into Large Language Models for Robot Motion Planning

要約 この論文では、時間的要素を含む人間のナビゲーション コマンドを解釈し、その … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY | Integrating Disambiguation and User Preferences into Large Language Models for Robot Motion Planning はコメントを受け付けていません

Holodeck: Language Guided Generation of 3D Embodied AI Environments

要約 3D シミュレーション環境は、身体化 AI において重要な役割を果たします … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Holodeck: Language Guided Generation of 3D Embodied AI Environments はコメントを受け付けていません

PPNet: A Two-Stage Neural Network for End-to-end Path Planning

要約 サンプリングベースのパス プランナーなどの古典的なパス プランナーは、プラ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | PPNet: A Two-Stage Neural Network for End-to-end Path Planning はコメントを受け付けていません

NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models

要約 最近の大規模な音声合成 (TTS) モデルは大幅な進歩を遂げていますが、音 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models はコメントを受け付けていません