-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation
要約 チャートやドキュメントなどの豊富なテキストを持つ画像に関する推論は、ビジョ … 続きを読む
VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs
要約 $ \ textbf {vidstyleode} $を提案します。 生成敵 … 続きを読む
カテゴリー: cs.CV
VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs はコメントを受け付けていません
Benchmarking Multimodal RAG through a Chart-based Document Question-Answering Generation Framework
要約 マルチモーダル検索の高等世代(MRAG)は、外部の知識を統合することにより … 続きを読む
Time Travel: A Comprehensive Benchmark to Evaluate LMMs on Historical and Cultural Artifacts
要約 歴史的および文化的アーティファクトを理解するには、人間の専門知識と高度な計 … 続きを読む
Generalizable Humanoid Manipulation with 3D Diffusion Policies
要約 多様な環境で自律的な操作が可能なヒューマノイドロボットは、長い間ロボット奏 … 続きを読む
BFA: Best-Feature-Aware Fusion for Multi-View Fine-grained Manipulation
要約 実際のシナリオでは、通常、マルチビューカメラが微調整された操作タスクに採用 … 続きを読む
Improving Collision-Free Success Rate For Object Goal Visual Navigation Via Two-Stage Training With Collision Prediction
要約 オブジェクト目標の視覚ナビゲーションは、エゴセントリックな視覚観測を使用し … 続きを読む
Towards Fusing Point Cloud and Visual Representations for Imitation Learning
要約 操作のための学習には、ポイントクラウドやRGB画像などの豊富な感覚情報にア … 続きを読む
Generalized Robot 3D Vision-Language Model with Fast Rendering and Pre-Training Vision-Language Alignment
要約 ディープニューラルネットワークモデルは、クローズドセットの設定でトレーニン … 続きを読む
MonoForce: Learnable Image-conditioned Physics Engine
要約 オンボードカメラの画像からの大まかなオフロード地形でのロボット軌跡の予測の … 続きを読む