-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Vision language models are unreliable at trivial spatial cognition
要約 ビジョン言語モデル(VLM)は、画像から関連する視覚空間情報を抽出するよう … 続きを読む
Describe Anything: Detailed Localized Image and Video Captioning
要約 画像やビデオで特定の領域の詳細かつ正確な説明を生成することは、ビジョン言語 … 続きを読む
Learning to Reason under Off-Policy Guidance
要約 大規模な推論モデル(LRMS)の最近の進歩は、マルチステップ推論や自己反省 … 続きを読む
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws
要約 大規模な言語モデル(LLMS)は、多数のタスクにわたって顕著な能力を実証し … 続きを読む
Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification
要約 生涯にわたる人の再識別(LREID)は、新しい情報に適応しながら古い知識を … 続きを読む
Synergistic Weak-Strong Collaboration by Aligning Preferences
要約 現在の大規模な言語モデル(LLM)は、一般的な推論で優れていますが、独自ま … 続きを読む
カテゴリー: cs.AI
Synergistic Weak-Strong Collaboration by Aligning Preferences はコメントを受け付けていません
From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
要約 近年、エンドツーエンドの自律運転アーキテクチャは、エラーの蓄積を回避する際 … 続きを読む
LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
要約 無人航空機(UAV)は、さまざまなプライベートおよび商業用アプリケーション … 続きを読む
Modality Selection and Skill Segmentation via Cross-Modality Attention
要約 触覚やオーディオなどの追加の感覚モダリティを基礎ロボットモデルに組み込むこ … 続きを読む
Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction
要約 一般化可能な自己修正システムの構築は、ロボットが障害から回復するために重要 … 続きを読む