cs.CV」カテゴリーアーカイブ

Improving 6D Object Pose Estimation of metallic Household and Industry Objects

要約 6Dオブジェクトのポーズ推定は、金属オブジェクトに適用すると精度が低下する … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

What to align in multimodal contrastive learning?

要約 人間は多感覚統合を通じて世界を認識し、さまざまなモダリティの情報を混ぜ合わ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

要約 一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む

カテゴリー: cs.CV | コメントする

A Generative Approach to High Fidelity 3D Reconstruction from Text Data

要約 生成的人工知能と高度なコンピュータービジョンテクノロジーの収束は、テキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance

要約 正確で忠実な運転シーンの再構築には、包括的なシーン情報を条件付き入力として … 続きを読む

カテゴリー: cs.CV | コメントする

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

要約 多くの大規模システムは、検索、検索、生成モデリングなどのタスクを容易にする … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | コメントする

Fractal Calibration for long-tailed object detection

要約 実際のデータセットは、不均衡な分布に続きます。これは、まれなカテゴリオブジ … 続きを読む

カテゴリー: cs.CV | コメントする

Rethinking Video Tokenization: A Conditioned Diffusion-based Approach

要約 ビデオをコンパクトな潜在表現に変換するビデオトークナーは、ビデオ生成の鍵で … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames

要約 RBG画像からのテクスチャーのないオブジェクトの6Dポーズを推定することは … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Rethinking Deep Clustering Paradigms: Self-Supervision Is All You Need

要約 深いクラスタリングの最近の進歩は、自己教師と疑似監督の学習の大幅な進歩によ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする