-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
RadEdit: stress-testing biomedical vision models via diffusion image editing
要約 バイオメディカルイメージングのデータセットはしばしば小さく偏りがあるため、 … 続きを読む
Domain Generalization through Meta-Learning: A Survey
要約 ディープニューラルネットワーク(DNN)は人工知能に革命をもたらしたが、実 … 続きを読む
Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition
要約 近年の研究により、大規模データを用いた一般的な視覚学習課題で事前に訓練され … 続きを読む
Text-Driven Image Editing via Learnable Regions
要約 言語は画像編集のための自然なインターフェースとして登場してきた。本論文では … 続きを読む
Enhancing Interpretability of Vertebrae Fracture Grading using Human-interpretable Prototypes
要約 椎体骨折の等級付けは、椎体骨折の重症度を分類するものであり、医用画像診断に … 続きを読む
FlightScope: A Deep Comprehensive Assessment of Aircraft Detection Algorithms in Satellite Imagery
要約 リモートセンシングされた衛星写真における物体検出は、生物物理学や環境モニタ … 続きを読む
On the Scalability of Diffusion-based Text-to-Image Generation
要約 モデルとデータサイズの拡大縮小は、LLMの進化においてかなり成功している。 … 続きを読む
DeiT-LT Distillation Strikes Back for Vision Transformer Training on Long-Tailed Datasets
要約 ヴィジョン・トランスフォーマー(ViT)は、様々なコンピュータ・ビジョン・ … 続きを読む
ALOHa: A New Measure for Hallucination in Captioning Models
要約 最近、視覚的説明のためのマルチモーダル事前学習が進歩したにもかかわらず、最 … 続きを読む
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
要約 我々はVisual AutoRegressive modeling (VA … 続きを読む