-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
The ALCHEmist: Automated Labeling 500x CHEaper Than LLM Data Annotators
要約 事前に訓練された大規模なモデルをアノテーターとして使用することで、クラウド … 続きを読む
The TIP of the Iceberg: Revealing a Hidden Class of Task-In-Prompt Adversarial Attacks on LLMs
要約 我々は、LLMに対する脱獄敵対的攻撃の新しいクラス、タスク・イン・プロンプ … 続きを読む
Boosting Asynchronous Decentralized Learning with Model Fragmentation
要約 分散学習(Decentralized Learning: DL)は、ウェブ … 続きを読む
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics
要約 長周期移動操作(MoMa)タスクを効率的に学習・実行することは、家庭や職場 … 続きを読む
EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition
要約 視覚的場所認識(Visual Place Recognition: VPR … 続きを読む
On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis
要約 最近、視覚的自己回帰($mathsf{VAR}$)モデルは、画像生成分野に … 続きを読む
RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation
要約 テキストからビデオへの生成モデルは目覚ましい進歩を遂げているが、複雑な特徴 … 続きを読む
Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization
要約 このタスクの目的は、追加的な更新に基づいて、画像の前提条件とテキストの仮説 … 続きを読む
UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent
要約 視覚-言語-行動(VLA)モデルの最近の進歩は、汎化能力を向上させるために … 続きを読む
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers
要約 事前に学習された強力な視覚言語モデル(VLMs)バックエンドを活用した大規 … 続きを読む