-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Enhancing 3D Gaze Estimation in the Wild using Weak Supervision with Gaze Following Labels
要約 制約されていない現実世界環境での正確な3D視線推定は、外観、ヘッドポーズ、 … 続きを読む
カテゴリー: cs.CV
Enhancing 3D Gaze Estimation in the Wild using Weak Supervision with Gaze Following Labels はコメントを受け付けていません
Deep Modeling of Non-Gaussian Aleatoric Uncertainty
要約 ディープラーニングは、特に不確実性分布が固定およびガウスの伝統的な仮定に適 … 続きを読む
Do computer vision foundation models learn the low-level characteristics of the human visual system?
要約 DinoやOpenClipなどのコンピュータービジョンファンデーションモデ … 続きを読む
カテゴリー: cs.CV
Do computer vision foundation models learn the low-level characteristics of the human visual system? はコメントを受け付けていません
Vector-Quantized Vision Foundation Models for Object-Centric Learning
要約 視覚的なシーンをオブジェクトに分解すると、人間がそうであるように、オブジェ … 続きを読む
カテゴリー: cs.CV
Vector-Quantized Vision Foundation Models for Object-Centric Learning はコメントを受け付けていません
HVI: A New color space for Low-light Image Enhancement
要約 Low-light Image Enhancement(LLIE)は、破損 … 続きを読む
Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions
要約 糖尿病の足潰瘍(DFU)の感染症は、組織死や四肢切断を含む重度の合併症を引 … 続きを読む
Visual Adaptive Prompting for Compositional Zero-Shot Learning
要約 Vision-Language Models(VLMS)は、視覚データとテ … 続きを読む
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription
要約 手書きのテキスト認識(HTR)は、特にページが共通のフォーマットとコンテキ … 続きを読む
A Dataset and Framework for Learning State-invariant Object Representations
要約 認識と検索のためにオブジェクト表現を学習するために、より一般的に使用される … 続きを読む
M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging
要約 エージェントAIシステムは、複雑なタスクを自律的に実行する能力について大き … 続きを読む