-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Multi-Agent System for Comprehensive Soccer Understanding
要約 AI主導のサッカー理解における最近の進歩は急速な進歩を示していますが、既存 … 続きを読む
カテゴリー: cs.CV
Multi-Agent System for Comprehensive Soccer Understanding はコメントを受け付けていません
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation
要約 拡散モデルは、テキストから画像の生成において優れたパフォーマンスを示してい … 続きを読む
カテゴリー: cs.CV
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation はコメントを受け付けていません
Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification
要約 監視されていない可視性のある人の再識別(UVI-reid)は、費用のかかる … 続きを読む
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology
要約 コンピュータービジョンの方法は、生態学的および生物学的ワークフローを合理化 … 続きを読む
カテゴリー: cs.CV
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology はコメントを受け付けていません
VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery
要約 単眼深度スケールの回復のための堅牢な方法を提案します。 単眼の深さ推定は、 … 続きを読む
カテゴリー: cs.CV
VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery はコメントを受け付けていません
Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations
要約 視覚的表現は、ジェネラリストのロボット政策の開発において重要な役割を果たし … 続きを読む
LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes
要約 自律運転のために合成ライダーデータを生成するための新しいパラダイムであるL … 続きを読む
MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans
要約 具体化されたAI(EAI)研究では、スキルの獲得、SIMからリアルへの転送 … 続きを読む
ForesightNav: Learning Scene Imagination for Efficient Exploration
要約 人間がどのように事前知識を活用して目に見えない環境をナビゲートしながら、探 … 続きを読む
Estimating Commonsense Scene Composition on Belief Scene Graphs
要約 この作業は、目に見えないオブジェクトの空間分布を推定することにより、信念シ … 続きを読む