月別アーカイブ: 2023年3月

CLIP goes 3D: Leveraging Prompt Tuning for Language Grounded 3D Recognition

要約 CLIP のようなビジョン言語モデルは、その印象的なゼロショット機能により … 続きを読む

カテゴリー: cs.CV | CLIP goes 3D: Leveraging Prompt Tuning for Language Grounded 3D Recognition はコメントを受け付けていません

Generative Semantic Segmentation

要約 セマンティック セグメンテーションの生成的学習アプローチである Gener … 続きを読む

カテゴリー: cs.CV | Generative Semantic Segmentation はコメントを受け付けていません

ScribbleSeg: Scribble-based Interactive Image Segmentation

要約 インタラクティブなセグメンテーションにより、ボックス、クリック、走り書きな … 続きを読む

カテゴリー: cs.CV | ScribbleSeg: Scribble-based Interactive Image Segmentation はコメントを受け付けていません

Open-vocabulary Panoptic Segmentation with Embedding Modulation

要約 オープンボキャブラリー画像セグメンテーションは、現実世界での重要なアプリケ … 続きを読む

カテゴリー: cs.CV | Open-vocabulary Panoptic Segmentation with Embedding Modulation はコメントを受け付けていません

Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-view 3D Understanding

要約 マルチビュー カメラ ベースの 3D 検出は、コンピューター ビジョンにお … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-view 3D Understanding はコメントを受け付けていません

3D Concept Learning and Reasoning from Multi-View Images

要約 人間は、周囲の世界の多視点観察を収集することにより、3D で正確に推論する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | 3D Concept Learning and Reasoning from Multi-View Images はコメントを受け付けていません

Zero-1-to-3: Zero-shot One Image to 3D Object

要約 単一の RGB 画像が与えられたときにオブジェクトのカメラ視点を変更するた … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.RO | Zero-1-to-3: Zero-shot One Image to 3D Object はコメントを受け付けていません

Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation

要約 私たちが知覚する画像と音は、頭を回転させると、微妙ではあるが幾何学的に一貫 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation はコメントを受け付けていません

Legs as Manipulator: Pushing Quadrupedal Agility Beyond Locomotion

要約 ロコモーションは、困難な地形を歩いたり走ったりするための劇的な進歩を遂げて … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Legs as Manipulator: Pushing Quadrupedal Agility Beyond Locomotion はコメントを受け付けていません

EVA-02: A Visual Representation for Neon Genesis

要約 EVA-02 は次世代の Transformer ベースの視覚的表現であり … 続きを読む

カテゴリー: cs.CL, cs.CV | EVA-02: A Visual Representation for Neon Genesis はコメントを受け付けていません