cs.CV」カテゴリーアーカイブ

GenEx: Generating an Explorable World

要約 3D の物理的な現実世界を理解し、ナビゲートし、探索することは、長い間、人 … 続きを読む

カテゴリー: cs.CV, cs.RO | GenEx: Generating an Explorable World はコメントを受け付けていません

The One RING: a Robotic Indoor Navigation Generalist

要約 現代のロボットは、形状、サイズ、環境を認識し相互作用するために使用されるセ … 続きを読む

カテゴリー: cs.CV, cs.RO | The One RING: a Robotic Indoor Navigation Generalist はコメントを受け付けていません

DriveGPT: Scaling Autoregressive Behavior Models for Driving

要約 自動運転のためのスケーラブルな動作モデルである DriveGPT を紹介し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DriveGPT: Scaling Autoregressive Behavior Models for Driving はコメントを受け付けていません

GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering

要約 身体的質問応答 (EQA) では、エージェントは、状況に応じた質問に自信を … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering はコメントを受け付けていません

A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space

要約 オープンセットオブジェクト検出 (OSOD) は、非構造化環境でのロボット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space はコメントを受け付けていません

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

要約 ロボット工学の最近の進歩は、複数のタスクを実行できるジェネラリスト ポリシ … 続きを読む

カテゴリー: cs.CV, cs.RO | Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations はコメントを受け付けていません

Cycle Pixel Difference Network for Crisp Edge Detection

要約 コンピューター ビジョンの基本的なタスクとしてのエッジ検出は、ますます注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | Cycle Pixel Difference Network for Crisp Edge Detection はコメントを受け付けていません

GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction

要約 神経表面表現は、新しいビュー合成と 3D 再構成の分野で目覚ましい成功を収 … 続きを読む

カテゴリー: cs.CV | GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction はコメントを受け付けていません

SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization

要約 線形層の量子化は広く使用されていますが、アテンションプロセスを加速するため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, cs.PF | SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization はコメントを受け付けていません

ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image

要約 最近の研究は画像から 3D オブジェクトへの生成で大きな成功を収めています … 続きを読む

カテゴリー: cs.CV | ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image はコメントを受け付けていません