I.2.10」カテゴリーアーカイブ

CoMatcher: Multi-View Collaborative Feature Matching

要約 このペーパーでは、複雑なシナリオでの信頼できるトラック構造のためのマルチビ … 続きを読む

カテゴリー: cs.CV, I.2.10 | コメントする

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントする

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む

カテゴリー: 68T07, 68T45, cs.CV, cs.LG, I.2.10 | コメントする

GroundCap: A Visually Grounded Image Captioning Dataset

要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.10 | コメントする

Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis

要約 表現学習と生成モデリングは視覚データを理解しようとしていますが、両方のドメ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis はコメントを受け付けていません

CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles

要約 このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles はコメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation はコメントを受け付けていません

VisRL: Intention-Driven Visual Perception via Reinforced Reasoning

要約 視覚的理解は本質的に意図駆動型です – 人間は目標に基づいてシ … 続きを読む

カテゴリー: cs.CV, I.2.10 | VisRL: Intention-Driven Visual Perception via Reinforced Reasoning はコメントを受け付けていません

NeuGrasp: Generalizable Neural Surface Reconstruction with Background Priors for Material-Agnostic Object Grasp Detection

要約 透明性と鏡面オブジェクトを使用したシーンでのロボット把握は、正確な深さ情報 … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.10 | NeuGrasp: Generalizable Neural Surface Reconstruction with Background Priors for Material-Agnostic Object Grasp Detection はコメントを受け付けていません

Multimodal Action Quality Assessment

要約 アクション品質評価(AQA)は、アクションがどれだけうまく実行されるかを評 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.SP, I.2.10 | Multimodal Action Quality Assessment はコメントを受け付けていません