-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Training-Free Consistency Pipeline for Fashion Repose
要約 拡散モデルの最近の進歩により、実際のオブジェクトの画像を編集する可能性が大 … 続きを読む
EventVL: Understand Event Streams via Multimodal Large Language Model
要約 イベントベースのビジョン言語モデル(VLM)は、最近、実用的なビジョンタス … 続きを読む
YOLO11-JDE: Fast and Accurate Multi-Object Tracking with Self-Supervised Re-ID
要約 リアルタイムオブジェクトの検出と自己監視の再識別(REID)を組み合わせた … 続きを読む
Skin Disease Detection and Classification of Actinic Keratosis and Psoriasis Utilizing Deep Transfer Learning
要約 皮膚疾患は、感染症、アレルギー、遺伝的要因、自己免疫疾患、ホルモンの不均衡 … 続きを読む
You Only Crash Once v2: Perceptually Consistent Strong Features for One-Stage Domain Adaptive Detection of Space Terrain
要約 惑星、月、および小体の表面地形の現場検出は、学習ベースのコンピュータービジ … 続きを読む
Solving the long-tailed distribution problem by exploiting the synergies and balance of different techniques
要約 現実世界のデータでは、ロングテールのデータ分布が一般的であるため、経験に基 … 続きを読む
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind
要約 複雑な現実世界のシナリオで人々の社会的相互作用を理解することは、しばしば複 … 続きを読む
Ensuring Medical AI Safety: Explainable AI-Driven Detection and Mitigation of Spurious Model Behavior and Associated Data
要約 ディープ ニューラル ネットワークは、実際には致命的な結果をもたらす可能性 … 続きを読む
Where Do You Go? Pedestrian Trajectory Prediction using Scene Features
要約 歩行者の軌跡を正確に予測することは、自動運転車の安全性を高め、歩行者が巻き … 続きを読む
Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning
要約 私たちは、きめ細かい視覚的理解を促進するために設計された初のパノプティック … 続きを読む