I.2.10」カテゴリーアーカイブ

Towards Global Localization using Multi-Modal Object-Instance Re-Identification

要約 再識別 (ReID) はコンピュータ ビジョンにおける重要な課題であり、主 … 続きを読む

カテゴリー: 68T40, cs.CV, cs.RO, I.2.10 | Towards Global Localization using Multi-Modal Object-Instance Re-Identification はコメントを受け付けていません

Towards Localizing Structural Elements: Merging Geometrical Detection with Semantic Verification in RGB-D Data

要約 RGB-D カメラは、シーンの理解、マップの再構築、位置特定などのさまざま … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | Towards Localizing Structural Elements: Merging Geometrical Detection with Semantic Verification in RGB-D Data はコメントを受け付けていません

StratXplore: Strategic Novelty-seeking and Instruction-aligned Exploration for Vision and Language Navigation

要約 身体的ナビゲーションでは、ロボットが与えられたタスクに基づいて環境を理解し … 続きを読む

カテゴリー: cs.RO, I.2.10 | StratXplore: Strategic Novelty-seeking and Instruction-aligned Exploration for Vision and Language Navigation はコメントを受け付けていません

Spatially-Aware Speaker for Vision-and-Language Navigation Instruction Generation

要約 身体化型 AI は、人間の言語の命令を \textit{理解}して実行し、 … 続きを読む

カテゴリー: cs.CL, I.2.10 | Spatially-Aware Speaker for Vision-and-Language Navigation Instruction Generation はコメントを受け付けていません

SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization

要約 Extreme Multimodal Summarization with … 続きを読む

カテゴリー: cs.CV, I.2.10 | SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization はコメントを受け付けていません

SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization

要約 Extreme Multimodal Summarization with … 続きを読む

カテゴリー: cs.CV, I.2.10 | SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization はコメントを受け付けていません

3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition

要約 自動運転車の点群データ認識にディープラーニング ネットワークを適応させるこ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | 3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition はコメントを受け付けていません

Beyond Few-shot Object Detection: A Detailed Survey

要約 物体検出は、画像やビデオ内の特定の物体を正確に識別して位置を特定することに … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Beyond Few-shot Object Detection: A Detailed Survey はコメントを受け付けていません

VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models

要約 ディープ ニューラル ネットワーク (DNN) は、タスクの自動化を可能に … 続きを読む

カテゴリー: (Primary), 68U10, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models はコメントを受け付けていません

Modeling the Neonatal Brain Development Using Implicit Neural Representations

要約 人間の脳は妊娠後期に急速に発達します。 この研究では、この年齢層の新生児の … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.10 | Modeling the Neonatal Brain Development Using Implicit Neural Representations はコメントを受け付けていません