-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression
要約 アクションとビデオのダイナミクスをモデリングするための不均一なマスク自己網 … 続きを読む
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation
要約 このペーパーでは、ユーザーが画像間生成のコンテキストで映画のビデオショット … 続きを読む
カテゴリー: cs.CV
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation はコメントを受け付けていません
SWAG: Long-term Surgical Workflow Prediction with Generative-based Anticipation
要約 既存のアプローチは現在の外科段階を認識することに優れていますが、将来の手続 … 続きを読む
SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning
要約 強化学習(RL)により、ソーシャルロボットは、人間が設計したルールや介入に … 続きを読む
Factorized Implicit Global Convolution for Automotive Computational Fluid Dynamics Prediction
要約 計算流体ダイナミクス(CFD)は自動車設計に不可欠であり、大きな3Dポイン … 続きを読む
カテゴリー: cs.CV
Factorized Implicit Global Convolution for Automotive Computational Fluid Dynamics Prediction はコメントを受け付けていません
sshELF: Single-Shot Hierarchical Extrapolation of Latent Features for 3D Reconstruction from Sparse-Views
要約 まばらな外向きの景色から無制限の屋外シーンを再構築することは、最小限の視野 … 続きを読む
カテゴリー: cs.CV
sshELF: Single-Shot Hierarchical Extrapolation of Latent Features for 3D Reconstruction from Sparse-Views はコメントを受け付けていません
ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features
要約 マルチモーダル拡散トランス(DITS)の豊富な表現は、解釈可能性を高めるユ … 続きを読む
WorldSense: Evaluating Real-world Omnimodal Understanding for Multimodal LLMs
要約 このペーパーでは、視覚、オーディオ、テキスト入力を同時に網羅するマルチモー … 続きを読む
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
要約 特にGPT-4Oに続く大規模な言語モデルの最近の進歩により、より多くのモダ … 続きを読む
SMART: Advancing Scalable Map Priors for Driving Topology Reasoning
要約 トポロジーの推論は、車線と交通要素の間の接続性と関係を包括的に理解すること … 続きを読む