「I.2.10」カテゴリーアーカイブ

CoMatcher: Multi-View Collaborative Feature Matching

投稿日: 2025年4月3日作成者: jarxiv

要約このペーパーでは、複雑なシナリオでの信頼できるトラック構造のためのマルチビ … 続きを読む →

カテゴリー: cs.CV, I.2.10 | コメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

投稿日: 2025年4月1日作成者: jarxiv

要約自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む →

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントを受け付けていません

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

投稿日: 2025年3月27日作成者: jarxiv

要約クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

GroundCap: A Visually Grounded Image Captioning Dataset

投稿日: 2025年3月25日作成者: jarxiv

要約現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む →

カテゴリー: cs.CL, cs.CV, I.2.10 | コメントを受け付けていません

Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis

投稿日: 2025年3月21日作成者: jarxiv

要約表現学習と生成モデリングは視覚データを理解しようとしていますが、両方のドメ … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles

投稿日: 2025年3月14日作成者: jarxiv

要約このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む →

カテゴリー: cs.AI, cs.AR, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | コメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

投稿日: 2025年3月13日作成者: jarxiv

要約トランス、特にビジョントランス（VITS）は、大規模な画像分類で最先端のパ … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

VisRL: Intention-Driven Visual Perception via Reinforced Reasoning

投稿日: 2025年3月11日作成者: jarxiv

要約視覚的理解は本質的に意図駆動型です – 人間は目標に基づいてシ … 続きを読む →

カテゴリー: cs.CV, I.2.10 | コメントを受け付けていません

NeuGrasp: Generalizable Neural Surface Reconstruction with Background Priors for Material-Agnostic Object Grasp Detection

投稿日: 2025年3月6日作成者: jarxiv

要約透明性と鏡面オブジェクトを使用したシーンでのロボット把握は、正確な深さ情報 … 続きを読む →

カテゴリー: cs.AI, cs.RO, I.2.10 | コメントを受け付けていません

Multimodal Action Quality Assessment

投稿日: 2025年3月6日作成者: jarxiv

要約アクション品質評価（AQA）は、アクションがどれだけうまく実行されるかを評 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.SP, I.2.10 | コメントを受け付けていません