-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Understanding Figurative Meaning through Explainable Visual Entailment
要約 大規模なビジョン言語モデル(VLM)は、視覚的な質問や視覚的誘惑など、画像 … 続きを読む
Generation and Detection of Sign Language Deepfakes – A Linguistic and Visual Analysis
要約 この研究では、上半身世代、特に聴覚障害者とハードの聴覚(DHOH)コミュニ … 続きを読む
Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination
要約 マルチモーダル大手言語モデル(MLLMS)の急速な進行により、さまざまなマ … 続きを読む
PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection
要約 ビジュアルインストラクションチューニングにより、事前に訓練されたマルチモー … 続きを読む
Diffusion Models without Classifier-free Guidance
要約 このホワイトペーパーでは、一般的に使用される分類器のないガイダンス(CFG … 続きを読む
S$^2$-Diffusion: Generalizing from Instance-level to Category-level Skills in Robot Manipulation
要約 スキル学習の最近の進歩により、ロボット操作は、実際の数のデモンストレーショ … 続きを読む
Graph Foundation Models for Recommendation: A Comprehensive Survey
要約 推奨システム(RS)は、オンライン情報の広大な広がりをナビゲートするための … 続きを読む
Vote-Tree-Planner: Optimizing Execution Order in LLM-based Task Planning Pipeline via Voting
要約 大規模な言語モデル(LLMS)を閉ループロボットタスク計画に統合することは … 続きを読む
Adaptive Teaming in Multi-Drone Pursuit: Simulation, Training, and Deployment
要約 適応的なチームは、事前の調整なしに目に見えないチームメイトと協力する能力で … 続きを読む
Efficient Evaluation of Multi-Task Robot Policies With Active Experiment Selection
要約 学習したロボット制御ポリシーを評価して、物理的なタスクレベルの機能を決定す … 続きを読む