cs.CV」カテゴリーアーカイブ

OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation

要約 Vision-Language Navigation(VLN)は、言語の指 … 続きを読む

カテゴリー: cs.CV, cs.RO | OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation はコメントを受け付けていません

PlaySlot: Learning Inverse Latent Dynamics for Controllable Object-Centric Video Prediction and Planning

要約 将来のシーンの表現を予測することは、ロボットが環境を理解して対話できるよう … 続きを読む

カテゴリー: cs.CV, cs.RO | PlaySlot: Learning Inverse Latent Dynamics for Controllable Object-Centric Video Prediction and Planning はコメントを受け付けていません

HV-BEV: Decoupling Horizontal and Vertical Feature Sampling for Multi-View 3D Object Detection

要約 ビジョンベースのマルチビュー環境認識システムの適用は、自律運転技術、特にB … 続きを読む

カテゴリー: cs.CV | HV-BEV: Decoupling Horizontal and Vertical Feature Sampling for Multi-View 3D Object Detection はコメントを受け付けていません

Explainable embeddings with Distance Explainer

要約 説明可能なAI(XAI)は大幅に進歩していますが、寸法が複雑な抽象化を表す … 続きを読む

カテゴリー: 68T99, cs.AI, cs.CL, cs.CV, cs.LG, I.2.m | Explainable embeddings with Distance Explainer はコメントを受け付けていません

Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network

要約 水中環境の制約を克服し、水中ターゲット検出モデルの精度と堅牢性を向上させる … 続きを読む

カテゴリー: cs.CV | Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network はコメントを受け付けていません

PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting

要約 近年、AIを使用して合成3Dオブジェクトを生成する能力が大幅に改善されてい … 続きを読む

カテゴリー: cs.CV, cs.GR, I.2.10 | PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting はコメントを受け付けていません

Clapper: Compact Learning and Video Representation in VLMs

要約 現在のビジョン言語モデル(VLM)は、多様なビデオ理解アプリケーション全体 … 続きを読む

カテゴリー: cs.CV | Clapper: Compact Learning and Video Representation in VLMs はコメントを受け付けていません

CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment

要約 視聴覚学習の最近の進歩により、モダリティ全体の学習表現における有望な結果が … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment はコメントを受け付けていません

Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field

要約 計算流体力学(CFD)は、流れ場を分析するための主なアプローチです。 ただ … 続きを読む

カテゴリー: cs.CV | Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field はコメントを受け付けていません

seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation

要約 3Dセマンティックセグメンテーションは、自律運転および道路インフラストラク … 続きを読む

カテゴリー: cs.CV | seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation はコメントを受け付けていません