-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Beyond Text: Utilizing Vocal Cues to Improve Decision Making in LLMs for Robot Navigation Tasks
要約 LLM は人間の会話におけるテキストの処理には優れていますが、ソーシャル … 続きを読む
XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts
要約 アップサイクルされた専門家混合 (MoE) をマージするだけで、命令調整さ … 続きを読む
Neuro-Inspired Hierarchical Multimodal Learning
要約 現実世界の包括的かつ正確な認識を得るには、さまざまなソースやモダリティから … 続きを読む
Aligning LLM Agents by Learning Latent Preference from User Edits
要約 私たちは、エージェントの出力に対して行われたユーザー編集に基づいて、言語エ … 続きを読む
A review of deep learning-based information fusion techniques for multimodal medical image classification
要約 マルチモーダル医用画像処理は、さまざまな画像処理装置からの情報を組み合わせ … 続きを読む
Visual Grounding Methods for VQA are Working for the Wrong Reasons!
要約 既存のビジュアル質問応答 (VQA) 手法は、正しい理由から正しい答えを生 … 続きを読む
Taming Diffusion Probabilistic Models for Character Control
要約 モーション拡散確率モデルを効果的に利用して、高品質で多様なキャラクター ア … 続きを読む
CutDiffusion: A Simple, Fast, Cheap, and Strong Diffusion Extrapolation Method
要約 高解像度の要求に応えるために、事前にトレーニングされた大規模な低解像度拡散 … 続きを読む
VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer
要約 道路の安全性の向上は、高度道路交通システム (ITS) にとって不可欠なコ … 続きを読む
Deep Models for Multi-View 3D Object Recognition: A Review
要約 人間の意思決定は、多くの場合、複数の視点や視点からの視覚情報に依存します。 … 続きを読む