-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Chitrarth: Bridging Vision and Language for a Billion People
要約 最近のマルチモーダルファンデーションモデルは、主に英語または高リソースのヨ … 続きを読む
Enhancing Vehicle Make and Model Recognition with 3D Attention Modules
要約 車両の製造およびモデル認識(VMMR)は、インテリジェント輸送システムの重 … 続きを読む
Evaluating Multimodal Generative AI with Korean Educational Standards
要約 このペーパーでは、韓国の国家教育テストを使用してマルチモーダル生成AIシス … 続きを読む
Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI
要約 神経線維腫症1型は、神経線維腫(NFS)の発症を特徴とする遺伝的障害であり … 続きを読む
LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection
要約 拡散モデルの進化により、画像生成の品質が劇的に向上し、実際の画像と生成され … 続きを読む
MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition
要約 マルチモーダルおよびマルチビューアプリケーション指向の産業部品認識の新しい … 続きを読む
Q-PETR: Quant-aware Position Embedding Transformation for Multi-View 3D Object Detection
要約 PETRベースの方法は、3D認識でベンチマークを支配しており、近代的な自律 … 続きを読む
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control
要約 拡散ブリッジモデルの最近の進歩は、Doobの$ H $ transform … 続きを読む
Depth-aware Fusion Method based on Image and 4D Radar Spectrum for 3D Object Detection
要約 安全性と信頼性は、自律運転を一般に受け入れるために重要です。 正確で信頼で … 続きを読む
Bridging vision language model (VLM) evaluation gaps with a framework for scalable and cost-effective benchmark generation
要約 AIモデルの信頼できる評価は、科学的進歩と実用的な応用にとって重要です。 … 続きを読む