- 
最近の投稿- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
 
- 
最近のコメント表示できるコメントはありません。
- cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830) 
「cs.AI」カテゴリーアーカイブ
FedSaaS: Class-Consistency Federated Semantic Segmentation via Global Prototype Supervision and Local Adversarial Harmonization
要約 フェデレーションセマンティックセグメンテーションにより、データプライバシー … 続きを読む
Efficient approximation of Earth Mover’s Distance Based on Nearest Neighbor Search
要約 Earth Moverの距離(EMD)は、コンピュータービジョンと他の多く … 続きを読む
UMotion: Uncertainty-driven Human Motion Estimation from Inertial and Ultra-wideband Units
要約 スパースウェアラブル慣性測定ユニット(IMUS)は、3Dヒトの動きを推定す … 続きを読む
Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records
要約 画像テキストの大腸内視鏡検査記録の事前トレーニングは、内視鏡画像分析を改善 … 続きを読む
A 2D Semantic-Aware Position Encoding for Vision Transformers
要約 ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む
Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput
要約 このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む
State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features
要約 眼窩周囲距離は、さまざまな眼形成および頭蓋顔面の状態を診断および監視するた … 続きを読む
Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations
要約 複数の動き腐敗した低解像度2Dスライスからの高解像度スライスから容積再構成 … 続きを読む
BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset
要約 統一された画像の理解と生成は、マルチモーダルモデルに関する最近の研究で注目 … 続きを読む
Variational Visual Question Answering
要約 視覚的な質問応答(VQA)のマルチモーダルモデルでは顕著な進歩にもかかわら … 続きを読む
