cs.CV」カテゴリーアーカイブ

Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) を使用したロボット マニピュ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

VADet: Multi-frame LiDAR 3D Object Detection using Variable Aggregation

要約 入力集約は、最先端の LiDAR 3D 物体検出器が検出を向上させるために … 続きを読む

カテゴリー: cs.CV | コメントする

MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes

要約 画像やビデオの制御可能な生成モデルは目覚ましい成功を収めていますが、3D … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Intensity-Spatial Dual Masked Autoencoder for Multi-Scale Feature Learning in Chest CT Segmentation

要約 医療画像セグメンテーションの分野では、不明瞭な病変の特徴、曖昧な境界、マル … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

An Integrated Approach to Robotic Object Grasping and Manipulation

要約 倉庫業務における手作業と効率化という増大する課題に対応して、Amazon … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

ViSTa Dataset: Do vision-language models understand sequential tasks?

要約 強化学習の報酬モデルとしてビジョン言語モデル (VLM) を使用すると、コ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer

要約 現在の話し顔の生成方法は、主に音声と口の同期に焦点を当てています。 しかし … 続きを読む

カテゴリー: cs.CV | コメントする

Occlusion-Aware Seamless Segmentation

要約 パノラマ画像は視野 (FoV) を広げることができ、オクルージョンを意識し … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation

要約 オープンボキャブラリーの 3D セマンティック セグメンテーションにおける … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

BelHouse3D: A Benchmark Dataset for Assessing Occlusion Robustness in 3D Point Cloud Semantic Segmentation

要約 大規模な 2D データセットは、機械学習の進歩に貢献してきました。 ただし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする