-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet
要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む
Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty
要約 生成 AI モデルに対するユーザー プロンプトは、多くの場合、仕様が不十分 … 続きを読む
Visual Lexicon: Rich Image Features in Language Space
要約 私たちは、自然言語で伝えるのが難しい複雑な視覚的詳細を保持しながら、豊富な … 続きを読む
Delve into Visual Contrastive Decoding for Hallucination Mitigation of Large Vision-Language Models
要約 大規模視覚言語モデル (LVLM) は、入力された視覚コンテンツと相関する … 続きを読む
Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving
要約 動的シーンのリアルタイム 4D 再構成は、自動運転の知覚にとって依然として … 続きを読む
P3-PO: Prescriptive Point Priors for Visuo-Spatial Generalization of Robot Policies
要約 さまざまな環境条件やオブジェクト インスタンスを堅牢に処理できる一般化可能 … 続きを読む
[MASK] is All You Need
要約 生成モデルでは、次のセット予測ベースのマスク生成モデルと次のノイズ予測ベー … 続きを読む
Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection
要約 オープンセット障害の自動検出と防止は、閉ループロボットシステムにおいて非常 … 続きを読む
APOLLO: SGD-like Memory, AdamW-level Performance
要約 大規模言語モデル (LLM) は、特に人気のある AdamW オプティマイ … 続きを読む
Enhancing FKG.in: automating Indian food composition analysis
要約 この論文では、インド料理のナレッジ グラフ (FKG.in) と LLM … 続きを読む