-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Where Do You Go? Pedestrian Trajectory Prediction using Scene Features
要約 歩行者の軌跡を正確に予測することは、自動運転車の安全性を高め、歩行者が巻き … 続きを読む
First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods
要約 粗粒の廃棄物の現在の廃棄施設は、重機を備えた材料の手動ソートを実行します。 … 続きを読む
Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings
要約 下肢骨折(LLF)は高齢者にとって大きな健康上の懸念であり、多くの場合、可 … 続きを読む
Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning
要約 私たちは、きめ細かい視覚的理解を促進するために設計された初のパノプティック … 続きを読む
GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration
要約 グラフィカル ユーザー インターフェイス (GUI) アクションのグラウン … 続きを読む
Improving Video Generation with Human Feedback
要約 ビデオ生成は、修正されたフロー技術によって大幅な進歩を遂げましたが、スムー … 続きを読む
Truncated Consistency Models
要約 一貫性モデルが最近導入され、初期ノイズからの確率フローオード(PF ODE … 続きを読む
Temporal Preference Optimization for Long-Form Video Understanding
要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む
IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models
要約 拡散モデルの急速な発展により、テキストからイメージ(T2I)モデルは大きな … 続きを読む
Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization
要約 テスト時間適応(TTA)は、トレーニングとテストデータの間の分布シフトに対 … 続きを読む