-
最近の投稿
- Repurposing Foundation Model for Generalizable Medical Time Series Classification
- Brittle Minds, Fixable Activations: Understanding Belief Representations in Language Models
- Cayley Graph Propagation
- Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning
- Continuously Optimizing Radar Placement with Model Predictive Path Integrals
-
最近のコメント
表示できるコメントはありません。 cs.AI (38325) cs.CL (28954) cs.CV (43855) cs.HC (2929) cs.LG (43255) cs.RO (22822) cs.SY (3505) eess.IV (5076) eess.SY (3497) stat.ML (5629)
月別アーカイブ: 2025年2月
Enhancing 3D Gaze Estimation in the Wild using Weak Supervision with Gaze Following Labels
要約 制約されていない現実世界環境での正確な3D視線推定は、外観、ヘッドポーズ、 … 続きを読む
カテゴリー: cs.CV
Enhancing 3D Gaze Estimation in the Wild using Weak Supervision with Gaze Following Labels はコメントを受け付けていません
Deep Modeling of Non-Gaussian Aleatoric Uncertainty
要約 ディープラーニングは、特に不確実性分布が固定およびガウスの伝統的な仮定に適 … 続きを読む
Do computer vision foundation models learn the low-level characteristics of the human visual system?
要約 DinoやOpenClipなどのコンピュータービジョンファンデーションモデ … 続きを読む
カテゴリー: cs.CV
Do computer vision foundation models learn the low-level characteristics of the human visual system? はコメントを受け付けていません
Vector-Quantized Vision Foundation Models for Object-Centric Learning
要約 視覚的なシーンをオブジェクトに分解すると、人間がそうであるように、オブジェ … 続きを読む
カテゴリー: cs.CV
Vector-Quantized Vision Foundation Models for Object-Centric Learning はコメントを受け付けていません
HVI: A New color space for Low-light Image Enhancement
要約 Low-light Image Enhancement(LLIE)は、破損 … 続きを読む
Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions
要約 糖尿病の足潰瘍(DFU)の感染症は、組織死や四肢切断を含む重度の合併症を引 … 続きを読む
Visual Adaptive Prompting for Compositional Zero-Shot Learning
要約 Vision-Language Models(VLMS)は、視覚データとテ … 続きを読む
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription
要約 手書きのテキスト認識(HTR)は、特にページが共通のフォーマットとコンテキ … 続きを読む
A Dataset and Framework for Learning State-invariant Object Representations
要約 認識と検索のためにオブジェクト表現を学習するために、より一般的に使用される … 続きを読む
M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging
要約 エージェントAIシステムは、複雑なタスクを自律的に実行する能力について大き … 続きを読む