cs.CV」カテゴリーアーカイブ

Multi-Agent System for Comprehensive Soccer Understanding

要約 AI主導のサッカー理解における最近の進歩は急速な進歩を示していますが、既存 … 続きを読む

カテゴリー: cs.CV | Multi-Agent System for Comprehensive Soccer Understanding はコメントを受け付けていません

MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation

要約 拡散モデルは、テキストから画像の生成において優れたパフォーマンスを示してい … 続きを読む

カテゴリー: cs.CV | MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation はコメントを受け付けていません

Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification

要約 監視されていない可視性のある人の再識別(UVI-reid)は、費用のかかる … 続きを読む

カテゴリー: cs.CV, cs.MM | Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification はコメントを受け付けていません

Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology

要約 コンピュータービジョンの方法は、生態学的および生物学的ワークフローを合理化 … 続きを読む

カテゴリー: cs.CV | Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology はコメントを受け付けていません

VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery

要約 単眼深度スケールの回復のための堅牢な方法を提案します。 単眼の深さ推定は、 … 続きを読む

カテゴリー: cs.CV | VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery はコメントを受け付けていません

Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations

要約 視覚的表現は、ジェネラリストのロボット政策の開発において重要な役割を果たし … 続きを読む

カテゴリー: cs.CV, cs.RO | Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations はコメントを受け付けていません

LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes

要約 自律運転のために合成ライダーデータを生成するための新しいパラダイムであるL … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes はコメントを受け付けていません

MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans

要約 具体化されたAI(EAI)研究では、スキルの獲得、SIMからリアルへの転送 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans はコメントを受け付けていません

ForesightNav: Learning Scene Imagination for Efficient Exploration

要約 人間がどのように事前知識を活用して目に見えない環境をナビゲートしながら、探 … 続きを読む

カテゴリー: cs.CV, cs.RO | ForesightNav: Learning Scene Imagination for Efficient Exploration はコメントを受け付けていません

Estimating Commonsense Scene Composition on Belief Scene Graphs

要約 この作業は、目に見えないオブジェクトの空間分布を推定することにより、信念シ … 続きを読む

カテゴリー: cs.CV, cs.RO | Estimating Commonsense Scene Composition on Belief Scene Graphs はコメントを受け付けていません