cs.CV」カテゴリーアーカイブ

ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting

要約 Gaussian Spluttingを活用する自律的な高忠実度再構成システ … 続きを読む

カテゴリー: cs.CV, cs.RO | ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting はコメントを受け付けていません

EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence

要約 具体化されたインテリジェンスタスクのトレーニングと評価には、物理​​的に現 … 続きを読む

カテゴリー: cs.CV, cs.RO | EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence はコメントを受け付けていません

Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning

要約 オープンワールド環境でナビゲートする自動運転車は、以前に見えなかったオブジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning はコメントを受け付けていません

BiFold: Bimanual Cloth Folding with Language Guidance

要約 布の折りたたみは、衣服の避けられない自己閉鎖、複雑なダイナミクス、衣服が持 … 続きを読む

カテゴリー: cs.CV, cs.RO | BiFold: Bimanual Cloth Folding with Language Guidance はコメントを受け付けていません

Zero-Shot Temporal Interaction Localization for Egocentric Videos

要約 ビデオ内のヒューマンオブジェクト相互作用(HOI)アクションを見つけること … 続きを読む

カテゴリー: cs.CV, cs.RO | Zero-Shot Temporal Interaction Localization for Egocentric Videos はコメントを受け付けていません

JENGA: Object selection and pose estimation for robotic grasping from a stack

要約 ビジョンベースのロボットオブジェクトの把握は、通常、ビンピッキングシナリオ … 続きを読む

カテゴリー: cs.CV, cs.RO | JENGA: Object selection and pose estimation for robotic grasping from a stack はコメントを受け付けていません

Leveraging Vision-Language Pre-training for Human Activity Recognition in Still Images

要約 単一の写真で人間の活動を認識することにより、インデックス、安全性、および支 … 続きを読む

カテゴリー: cs.CL, cs.CV | Leveraging Vision-Language Pre-training for Human Activity Recognition in Still Images はコメントを受け付けていません

GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field

要約 平面ジオメトリダイアグラムの合成は、コンピューターグラフィックスの重要なタ … 続きを読む

カテゴリー: cs.CV | GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field はコメントを受け付けていません

Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval

要約 特許画像は、特許の革新に関する情報を伝える技術的な図面です。 特許画像検索 … 続きを読む

カテゴリー: 68T07, 68T45, cs.CV, cs.IR, cs.LG, H.3.3 | Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval はコメントを受け付けていません

Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning

要約 3Dシーンの理解の進歩を奨励しているにもかかわらず、複雑な3D環境で理解と … 続きを読む

カテゴリー: cs.CV | Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning はコメントを受け付けていません