-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning
要約 幼児は、言語入力の獲得に先立って、複雑な視覚的理解を急速に発達させます。 … 続きを読む
Towards Balanced Continual Multi-Modal Learning in Human Pose Estimation
要約 3D 人間姿勢推定 (3D HPE) は、特に RGB ベースの手法の分野 … 続きを読む
Geometry Restoration and Dewarping of Camera-Captured Document Images
要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む
Less is More: The Influence of Pruning on the Explainability of CNNs
要約 コンピューター ビジョンにおける最新の畳み込みニューラル ネットワーク ( … 続きを読む
A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics
要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む
AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning
要約 オンラインで入手可能な画像テキスト データの膨大なリポジトリを活用して、大 … 続きを読む
Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces
要約 ビデオ トークナイザーは潜在ビデオ拡散モデルに不可欠であり、生のビデオ デ … 続きを読む
Consistent Flow Distillation for Text-to-3D Generation
要約 スコア蒸留サンプリング (SDS) は、3D 生成用の画像生成モデルの蒸留 … 続きを読む
An Empirical Study of Autoregressive Pre-training from Videos
要約 私たちはビデオからの自己回帰事前トレーニングを実証的に研究しています。 研 … 続きを読む
MedCoDi-M: A Multi-Prompt Foundation Model for Multimodal Medical Data Generation
要約 人工知能は医療現場に革命をもたらし、診断の精度と医療提供を強化しています。 … 続きを読む