「cs.CV」カテゴリーアーカイブ

Multi-Agent System for Comprehensive Soccer Understanding

投稿日: 2025年5月7日作成者: jarxiv

要約 AI主導のサッカー理解における最近の進歩は急速な進歩を示していますが、既存 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation

投稿日: 2025年5月7日作成者: jarxiv

要約拡散モデルは、テキストから画像の生成において優れたパフォーマンスを示してい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification

投稿日: 2025年5月7日作成者: jarxiv

要約監視されていない可視性のある人の再識別（UVI-reid）は、費用のかかる … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology

投稿日: 2025年5月7日作成者: jarxiv

要約コンピュータービジョンの方法は、生態学的および生物学的ワークフローを合理化 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery

投稿日: 2025年5月7日作成者: jarxiv

要約単眼深度スケールの回復のための堅牢な方法を提案します。単眼の深さ推定は、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

投稿日: 2025年5月6日作成者: jarxiv

要約視覚的表現は、ジェネラリストのロボット政策の開発において重要な役割を果たし … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes

投稿日: 2025年5月6日作成者: jarxiv

要約自律運転のために合成ライダーデータを生成するための新しいパラダイムであるL … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans

投稿日: 2025年5月6日作成者: jarxiv

要約具体化されたAI（EAI）研究では、スキルの獲得、SIMからリアルへの転送 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

ForesightNav: Learning Scene Imagination for Efficient Exploration

投稿日: 2025年5月6日作成者: jarxiv

要約人間がどのように事前知識を活用して目に見えない環境をナビゲートしながら、探 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Estimating Commonsense Scene Composition on Belief Scene Graphs

投稿日: 2025年5月6日作成者: jarxiv

要約この作業は、目に見えないオブジェクトの空間分布を推定することにより、信念シ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Multi-Agent System for Comprehensive Soccer Understanding

MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation

Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification

Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology

VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes

MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans

ForesightNav: Learning Scene Imagination for Efficient Exploration

Estimating Commonsense Scene Composition on Belief Scene Graphs

最近の投稿

最近のコメント

アーカイブ

カテゴリー