-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
SITE: towards Spatial Intelligence Thorough Evaluation
要約 Spatial Intelligence(SI)は、神経科学からロボット工 … 続きを読む
カテゴリー: cs.CV
SITE: towards Spatial Intelligence Thorough Evaluation はコメントを受け付けていません
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant
要約 StreamBridgeを紹介します。これは、オフラインのビデオllmsを … 続きを読む
Generating Physically Stable and Buildable LEGO Designs from Text
要約 テキストプロンプトから物理的に安定したレゴブリックモデルを生成するための最 … 続きを読む
カテゴリー: cs.CV
Generating Physically Stable and Buildable LEGO Designs from Text はコメントを受け付けていません
Flow-GRPO: Training Flow Matching Models via Online RL
要約 Flow-Grpoを提案します。これは、オンライン強化学習(RL)をフロー … 続きを読む
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation
要約 画像の理解と生成のための統一されたモデルの最近の進歩は印象的ですが、ほとん … 続きを読む
カテゴリー: cs.CV
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation はコメントを受け付けていません
DiffusionSfM: Predicting Structure and Motion via Ray Origin and Endpoint Diffusion
要約 現在の構造からの構造(SFM)メソッドは、通常、2段階のパイプラインに続き … 続きを読む
カテゴリー: cs.CV
DiffusionSfM: Predicting Structure and Motion via Ray Origin and Endpoint Diffusion はコメントを受け付けていません
3D Scene Generation: A Survey
要約 3Dシーンジェネレーションは、没入型メディア、ロボット工学、自律運転、具体 … 続きを読む
カテゴリー: cs.CV
3D Scene Generation: A Survey はコメントを受け付けていません
SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation
要約 単一の画像から高品質のアニメーション可能な3Dヒトアバターを作成すると、単 … 続きを読む
カテゴリー: cs.CV
SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation はコメントを受け付けていません
Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid
要約 保証された安全性分離は、共有空域で空中車両のシームレスな高密度操作を達成す … 続きを読む
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation
要約 ロボット工学の効率的なパス計画、特に大規模で動的な環境内では、依然として重 … 続きを読む