-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Quantifying and Enabling the Interpretability of CLIP-like Models
要約 CLIP は最も人気のある基本モデルの 1 つであり、多くの視覚言語タスク … 続きを読む
EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis
要約 緑内障、黄斑変性症、糖尿病性網膜症などの眼疾患を早期に発見することは、視力 … 続きを読む
World-Grounded Human Motion Recovery via Gravity-View Coordinates
要約 単眼ビデオから世界を基準とした人間の動きを復元するための新しい方法を紹介し … 続きを読む
Hint-AD: Holistically Aligned Interpretability in End-to-End Autonomous Driving
要約 自動運転 (AD) におけるエンドツーエンドのアーキテクチャは、人間と A … 続きを読む
What Did My Car Say? Impact of Autonomous Vehicle Explanation Errors and Driving Context On Comfort, Reliance, Satisfaction, and Driving Confidence
要約 自動運転車 (AV) の決定についての説明は信頼を築く可能性がありますが、 … 続きを読む
Question-Answering Dense Video Events
要約 マルチモーダル大規模言語モデル (MLLM) は、単一イベント ビデオの質 … 続きを読む
Towards Building a Robust Knowledge Intensive Question Answering Model with Large Language Models
要約 LLM の開発により、質問応答のインテリジェンスと流暢さが大幅に向上し、検 … 続きを読む
MemoRAG: Moving towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery
要約 検索拡張生成 (RAG) は、検索ツールを活用して外部データベースにアクセ … 続きを読む
NeurLZ: On Enhancing Lossy Compression Performance based on Error-Controlled Neural Learning for Scientific Data
要約 大規模な科学シミュレーションでは、ストレージと I/O に重大な課題を引き … 続きを読む