-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization
要約 近年、音楽タグ付け、楽器分類、キー検出など、様々な音楽インフォマティクス理 … 続きを読む
Speech Retrieval-Augmented Generation without Automatic Speech Recognition
要約 音声データに対する質問応答の一般的なアプローチの1つは、まず自動音声認識( … 続きを読む
Predicate Invention from Pixels via Pretrained Vision-Language Models
要約 我々の目的は、画像という形の生のセンサー入力が与えられた、変動が激しく、組 … 続きを読む
Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments
要約 ソフトグローイングロボットは、散らかった環境や危険な環境でのナビゲーション … 続きを読む
H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters
要約 カテーテル治療の成功率は、外科医に提供される感覚データと密接な関係がある。 … 続きを読む
MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception
要約 マルチセンサーフュージョンモデルは、自律走行知覚、特に3D物体検出やHDマ … 続きを読む
Symmetries-enhanced Multi-Agent Reinforcement Learning
要約 マルチエージェント強化学習は、エージェントが複雑で協調的な行動を学習するた … 続きを読む
Risks of Cultural Erasure in Large Language Models
要約 大規模な言語モデルは、検索、オンライン教育、旅行計画など、社会的知識の生産 … 続きを読む
MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization
要約 近年、音楽タグ付け、楽器分類、キー検出など、様々な音楽理解タスクにおいて、 … 続きを読む
TED: Turn Emphasis with Dialogue Feature Attention for Emotion Recognition in Conversation
要約 会話における感情認識(ERC)は、複数ターンの文脈をモデル化する手法によっ … 続きを読む