cs.CV」カテゴリーアーカイブ

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

要約 強化学習(RL)の最近の進歩により、視覚言語モデル(VLM)の推論能力が強 … 続きを読む

カテゴリー: cs.CV | NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation はコメントを受け付けていません

RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond

要約 マルチビューイメージングとポーズ推定の統合は、コンピュータービジョンアプリ … 続きを読む

カテゴリー: cs.CV | RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond はコメントを受け付けていません

SaSi: A Self-augmented and Self-interpreted Deep Learning Approach for Few-shot Cryo-ET Particle Detection

要約 Cryo-Electron断層撮影(Cryo-ET)は、ネイティブに近い州 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SaSi: A Self-augmented and Self-interpreted Deep Learning Approach for Few-shot Cryo-ET Particle Detection はコメントを受け付けていません

Multimodal Reasoning Agent for Zero-Shot Composed Image Retrieval

要約 Zero-Shot Composed Image Retrieval(ZS … 続きを読む

カテゴリー: cs.CV, cs.IR | Multimodal Reasoning Agent for Zero-Shot Composed Image Retrieval はコメントを受け付けていません

DeepEyes: Incentivizing ‘Thinking with Images’ via Reinforcement Learning

要約 大規模なビジョン言語モデル(VLM)は、マルチモーダルの理解と推論に強力な … 続きを読む

カテゴリー: cs.CV | DeepEyes: Incentivizing ‘Thinking with Images’ via Reinforcement Learning はコメントを受け付けていません

UltraVSR: Achieving Ultra-Realistic Video Super-Resolution with Efficient One-Step Diffusion Space

要約 拡散モデルは、現実的な画像の詳細を生成する大きな可能性を示しています。 た … 続きを読む

カテゴリー: cs.CV | UltraVSR: Achieving Ultra-Realistic Video Super-Resolution with Efficient One-Step Diffusion Space はコメントを受け付けていません

PHI: Bridging Domain Shift in Long-Term Action Quality Assessment via Progressive Hierarchical Instruction

要約 長期アクション品質評価(AQA)は、長いビデオでのアクションの定量的パフォ … 続きを読む

カテゴリー: cs.CV | PHI: Bridging Domain Shift in Long-Term Action Quality Assessment via Progressive Hierarchical Instruction はコメントを受け付けていません

Domain-Agnostic Stroke Lesion Segmentation Using Physics-Constrained Synthetic Data

要約 MRIの脳卒中病変のセグメント化は、モデルの一般化可能性を制限する多様な獲 … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Domain-Agnostic Stroke Lesion Segmentation Using Physics-Constrained Synthetic Data はコメントを受け付けていません

ICDM: Interference Cancellation Diffusion Models for Wireless Semantic Communications

要約 拡散モデル(DMS)は、最近、除去能力のためにワイヤレス通信システムで大き … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, math.IT | ICDM: Interference Cancellation Diffusion Models for Wireless Semantic Communications はコメントを受け付けていません

From Single Images to Motion Policies via Video-Generation Environment Representations

要約 自律的なロボットは通常、周囲の表現を構築し、環境の幾何学に動きを適応させる … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.RO | From Single Images to Motion Policies via Video-Generation Environment Representations はコメントを受け付けていません