「cs.CV」カテゴリーアーカイブ

GenEx: Generating an Explorable World

投稿日: 2024年12月20日作成者: jarxiv

要約 3D の物理的な現実世界を理解し、ナビゲートし、探索することは、長い間、人 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

The One RING: a Robotic Indoor Navigation Generalist

投稿日: 2024年12月20日作成者: jarxiv

要約現代のロボットは、形状、サイズ、環境を認識し相互作用するために使用されるセ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

DriveGPT: Scaling Autoregressive Behavior Models for Driving

投稿日: 2024年12月20日作成者: jarxiv

要約自動運転のためのスケーラブルな動作モデルである DriveGPT を紹介し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering

投稿日: 2024年12月20日作成者: jarxiv

要約身体的質問応答 (EQA) では、エージェントは、状況に応じた質問に自信を … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space

投稿日: 2024年12月20日作成者: jarxiv

要約オープンセットオブジェクト検出 (OSOD) は、非構造化環境でのロボット … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

投稿日: 2024年12月20日作成者: jarxiv

要約ロボット工学の最近の進歩は、複数のタスクを実行できるジェネラリストポリシ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Cycle Pixel Difference Network for Crisp Edge Detection

投稿日: 2024年12月20日作成者: jarxiv

要約コンピュータービジョンの基本的なタスクとしてのエッジ検出は、ますます注目 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction

投稿日: 2024年12月20日作成者: jarxiv

要約神経表面表現は、新しいビュー合成と 3D 再構成の分野で目覚ましい成功を収 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization

投稿日: 2024年12月20日作成者: jarxiv

要約線形層の量子化は広く使用されていますが、アテンションプロセスを加速するため … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, cs.PF | コメントを受け付けていません

ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image

投稿日: 2024年12月20日作成者: jarxiv

要約最近の研究は画像から 3D オブジェクトへの生成で大きな成功を収めています … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

GenEx: Generating an Explorable World

The One RING: a Robotic Indoor Navigation Generalist

DriveGPT: Scaling Autoregressive Behavior Models for Driving

GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering

A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

Cycle Pixel Difference Network for Crisp Edge Detection

GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction

SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization

ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image

最近の投稿

最近のコメント

アーカイブ

カテゴリー