「cs.CV」カテゴリーアーカイブ

ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting

投稿日: 2025年6月17日作成者: jarxiv

要約 Gaussian Spluttingを活用する自律的な高忠実度再構成システ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence

投稿日: 2025年6月17日作成者: jarxiv

要約具体化されたインテリジェンスタスクのトレーニングと評価には、物理的に現 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning

投稿日: 2025年6月17日作成者: jarxiv

要約オープンワールド環境でナビゲートする自動運転車は、以前に見えなかったオブジ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

BiFold: Bimanual Cloth Folding with Language Guidance

投稿日: 2025年6月17日作成者: jarxiv

要約布の折りたたみは、衣服の避けられない自己閉鎖、複雑なダイナミクス、衣服が持 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Zero-Shot Temporal Interaction Localization for Egocentric Videos

投稿日: 2025年6月17日作成者: jarxiv

要約ビデオ内のヒューマンオブジェクト相互作用（HOI）アクションを見つけること … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

JENGA: Object selection and pose estimation for robotic grasping from a stack

投稿日: 2025年6月17日作成者: jarxiv

要約ビジョンベースのロボットオブジェクトの把握は、通常、ビンピッキングシナリオ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Leveraging Vision-Language Pre-training for Human Activity Recognition in Still Images

投稿日: 2025年6月17日作成者: jarxiv

要約単一の写真で人間の活動を認識することにより、インデックス、安全性、および支 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field

投稿日: 2025年6月17日作成者: jarxiv

要約平面ジオメトリダイアグラムの合成は、コンピューターグラフィックスの重要なタ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval

投稿日: 2025年6月17日作成者: jarxiv

要約特許画像は、特許の革新に関する情報を伝える技術的な図面です。特許画像検索 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.CV, cs.IR, cs.LG, H.3.3 | コメントを受け付けていません

Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning

投稿日: 2025年6月17日作成者: jarxiv

要約 3Dシーンの理解の進歩を奨励しているにもかかわらず、複雑な3D環境で理解と … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting

EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence

Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning

BiFold: Bimanual Cloth Folding with Language Guidance

Zero-Shot Temporal Interaction Localization for Egocentric Videos

JENGA: Object selection and pose estimation for robotic grasping from a stack

Leveraging Vision-Language Pre-training for Human Activity Recognition in Still Images

GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field

Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval

Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning

最近の投稿

最近のコメント

アーカイブ

カテゴリー