-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Visual Acoustic Fields
要約 オブジェクトはヒットすると異なる音を生成し、人間はその外観と材料特性に基づ … 続きを読む
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion
要約 パラメーター生成は、ニューラルネットワーク開発の新しいパラダイムとして浮上 … 続きを読む
Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1
要約 Chain of Thound(COT)の最近の進歩により、大規模な言語モ … 続きを読む
Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation
要約 現在のビデオ生成コミュニティ内の正確なユーザー意図解釈のボトルネックに対処 … 続きを読む
UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving
要約 UNIOCCは、カメラ画像からの占有予測(つまり、歴史的情報に基づいて将来 … 続きを読む
Evil twins are not that evil: Qualitative insights into machine-generated prompts
要約 言語モデル(LMS)は、予測可能な方法で、一見理解できないように見えるアル … 続きを読む
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models
要約 アクションモデルは、自律エージェントが複雑なタスクを実行できるようにするた … 続きを読む
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning
要約 エントロピー誘導シーケンス重み付け(EGSW)を導入します。これは、強化学 … 続きを読む
Multimodal Object Detection using Depth and Image Data for Manufacturing Parts
要約 製造には、多様な種類の製造部品とコンポーネントの正確なピッキングと取り扱い … 続きを読む
Data-Agnostic Robotic Long-Horizon Manipulation with Vision-Language-Guided Closed-Loop Feedback
要約 言語条件付きのロボット操作の最近の進歩により、ロボットが人間のコマンドから … 続きを読む