月別アーカイブ: 2024年5月

LARM: Large Auto-Regressive Model for Long-Horizon Embodied Intelligence

要約 実体エージェントは現実世界と対話する必要があるため、包括的な事前知識、長期 … 続きを読む

カテゴリー: cs.CV | LARM: Large Auto-Regressive Model for Long-Horizon Embodied Intelligence はコメントを受け付けていません

Benchmarking and Improving Bird’s Eye View Perception Robustness in Autonomous Driving

要約 鳥瞰図 (BEV) 表現における最近の進歩により、車内の 3D 認識が大幅 … 続きを読む

カテゴリー: cs.CV, cs.RO | Benchmarking and Improving Bird’s Eye View Perception Robustness in Autonomous Driving はコメントを受け付けていません

Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model

要約 マルチモーダル大規模言語モデル (LLM) の最近の進歩により、さまざまな … 続きを読む

カテゴリー: cs.CV | Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model はコメントを受け付けていません

GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction

要約 3D セマンティック占有予測は、周囲のシーンの 3D のきめの細かいジオメ … 続きを読む

カテゴリー: cs.AI, cs.CV | GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction はコメントを受け付けていません

Matryoshka Multimodal Models

要約 LLaVA などの大規模マルチモーダル モデル (LMM) は、視覚言語推 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Matryoshka Multimodal Models はコメントを受け付けていません

NGM-SLAM: Gaussian Splatting SLAM with Radiance Field Submap

要約 ガウス スプラッティングに基づく SLAM システムは、高速なリアルタイム … 続きを読む

カテゴリー: cs.RO | NGM-SLAM: Gaussian Splatting SLAM with Radiance Field Submap はコメントを受け付けていません

Isotropy, Clusters, and Classifiers

要約 埋め込み空間がすべての次元を均等に使用するかどうか、つまり等方性であるかど … 続きを読む

カテゴリー: cs.CL, cs.LG | Isotropy, Clusters, and Classifiers はコメントを受け付けていません

Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top

要約 知識編集 (KE) の下でのマルチホップ質問応答 (MQA) は、大規模言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top はコメントを受け付けていません

Leveraging Unknown Objects to Construct Labeled-Unlabeled Meta-Relationships for Zero-Shot Object Navigation

要約 ゼロショット オブジェクト ナビゲーション (ZSON) は、トレーニング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Leveraging Unknown Objects to Construct Labeled-Unlabeled Meta-Relationships for Zero-Shot Object Navigation はコメントを受け付けていません

HiddenSpeaker: Generate Imperceptible Unlearnable Audios for Speaker Verification System

要約 近年、ディープニューラルネットワークの目覚ましい発展により、大変便利になり … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | HiddenSpeaker: Generate Imperceptible Unlearnable Audios for Speaker Verification System はコメントを受け付けていません