I.2.10」カテゴリーアーカイブ

CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles

要約 このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles はコメントを受け付けていません

BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution

要約 超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制 … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, I.2.10 | BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution はコメントを受け付けていません

CoMatcher: Multi-View Collaborative Feature Matching

要約 このペーパーでは、複雑なシナリオでの信頼できるトラック構造のためのマルチビ … 続きを読む

カテゴリー: cs.CV, I.2.10 | CoMatcher: Multi-View Collaborative Feature Matching はコメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models はコメントを受け付けていません

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む

カテゴリー: 68T07, 68T45, cs.CV, cs.LG, I.2.10 | Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations はコメントを受け付けていません

GroundCap: A Visually Grounded Image Captioning Dataset

要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.10 | GroundCap: A Visually Grounded Image Captioning Dataset はコメントを受け付けていません

Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis

要約 表現学習と生成モデリングは視覚データを理解しようとしていますが、両方のドメ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis はコメントを受け付けていません

CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles

要約 このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles はコメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation はコメントを受け付けていません

VisRL: Intention-Driven Visual Perception via Reinforced Reasoning

要約 視覚的理解は本質的に意図駆動型です – 人間は目標に基づいてシ … 続きを読む

カテゴリー: cs.CV, I.2.10 | VisRL: Intention-Driven Visual Perception via Reinforced Reasoning はコメントを受け付けていません