-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Theia: Distilling Diverse Vision Foundation Models for Robot Learning
要約 視覚入力をアクションにマッピングする視覚ベースのロボット ポリシー学習では … 続きを読む
SANGRIA: Surgical Video Scene Graph Optimization for Surgical Workflow Prediction
要約 グラフベースの全体的なシーン表現は、外科ワークフローの理解を容易にし、最近 … 続きを読む
Matryoshka Multimodal Models
要約 LLaVA などの大規模マルチモーダル モデル (LMM) は、視覚言語推 … 続きを読む
SAPG: Split and Aggregate Policy Gradients
要約 極端なサンプルの非効率にもかかわらず、ポリシーに基づく強化学習、別名ポリシ … 続きを読む
Specify and Edit: Overcoming Ambiguity in Text-Based Image Editing
要約 テキストベースの編集普及モデルは、ユーザーの入力指示があいまいな場合、パフ … 続きを読む
DART: An Automated End-to-End Object Detection Pipeline with Data Diversification, Open-Vocabulary Bounding Box Annotation, Pseudo-Label Review, and Model Training
要約 正確なリアルタイムの物体検出は、安全監視から品質管理に至るまで、数多くの産 … 続きを読む
Multi-Agent Trajectory Prediction with Difficulty-Guided Feature Enhancement Network
要約 軌道予測は、交通参加者の将来の動きを予測することを目的としているため、自動 … 続きを読む
A Role-specific Guided Large Language Model for Ophthalmic Consultation Based on Stylistic Differentiation
要約 眼科の診察は、目の病気の診断、治療、予防にとって非常に重要です。 しかし、 … 続きを読む
Knowledge Graph Structure as Prompt: Improving Small Language Models Capabilities for Knowledge-based Causal Discovery
要約 因果関係発見は、観測データに基づいて変数間の因果構造を推定することを目的と … 続きを読む
CarDreamer: Open-Source Learning Platform for World Model based Autonomous Driving
要約 現実世界の複雑なシナリオを安全にナビゲートするには、自動運転車はさまざまな … 続きを読む