-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Deep Sylvester Posterior Inference for Adaptive Compressed Sensing in Ultrasound Imaging
要約 超音波画像は通常、ビーム操作された走査線を順次取得することによって形成され … 続きを読む
SCC-YOLO: An Improved Object Detector for Assisting in Brain Tumor Diagnosis
要約 脳腫瘍は、神経機能障害、認知的および心理的状態の変化、頭蓋内圧の上昇、発作 … 続きを読む
Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control
要約 拡散モデルは、テキスト プロンプトや画像から高品質のビデオを生成する際に優 … 続きを読む
CL3DOR: Contrastive Learning for 3D Large Multimodal Models via Odds Ratio on High-Resolution Point Clouds
要約 最近の研究では、大規模言語モデル (LLM) がテキストのみのタスクに限定 … 続きを読む
Deep Learning-based Accelerated MR Cholangiopancreatography without Fully-sampled Data
要約 この研究の目的は、3T および 0.55T での深層学習ベース (DL) … 続きを読む
LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token
要約 GPT-4o のようなリアルタイム大規模マルチモーダル モデル (LMM) … 続きを読む
Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
要約 科学研究のパラダイムは、人工知能 (AI) の発展により大きな変革を迎えて … 続きを読む
VLM-driven Behavior Tree for Context-aware Task Planning
要約 ビヘイビア ツリー (BT) を生成するための大規模言語モデル (LLM) … 続きを読む
Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders
要約 生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む