「cs.CV」カテゴリーアーカイブ

Towards Cross-device and Training-free Robotic Grasping in 3D Open World

投稿日: 2024年11月28日作成者: jarxiv

要約オープンワールドにおけるロボットによる把握は、製造および自動化プロセスの重 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Online Knowledge Integration for 3D Semantic Mapping: A Survey

投稿日: 2024年11月28日作成者: jarxiv

要約セマンティックマッピングは、構造化された環境内で動作し、オブジェクトと対 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving

投稿日: 2024年11月28日作成者: jarxiv

要約基盤モデルの急速なスケーリングが特徴的な時代において、自動運転技術は、デー … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation

投稿日: 2024年11月28日作成者: jarxiv

要約環境の高解像度 (HD) セマンティックマップの生成は、自動運転の重要な … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation

投稿日: 2024年11月28日作成者: jarxiv

要約ロボット操作における人間の指示を考えずに実行すると、中毒、火災、さらには爆 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

投稿日: 2024年11月28日作成者: jarxiv

要約視覚言語モデル (VLM) は、マルチモーダル推論タスクにおいて目覚ましい … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement

投稿日: 2024年11月28日作成者: jarxiv

要約 CT レポート生成 (CTRG) は、3D ボリュームの診断レポートを自動 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

投稿日: 2024年11月28日作成者: jarxiv

要約ステレオ深度推定における大幅な進歩にもかかわらず、主に適切なデータの欠如に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology

投稿日: 2024年11月28日作成者: jarxiv

要約遠隔光電脈波計 (rPPG) は、顔のビデオから心臓信号を測定する非接触方 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | コメントを受け付けていません

TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models

投稿日: 2024年11月28日作成者: jarxiv

要約この論文では、衣服を着た個人の 1 枚の写真から標準化された衣服画像を生成 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Towards Cross-device and Training-free Robotic Grasping in 3D Open World

Online Knowledge Integration for 3D Semantic Mapping: A Survey

Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving

SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation

Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology

TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー