-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Hierarchical Sparse Attention Framework for Computationally Efficient Classification of Biological Cells
要約 Sparseattnnetは、画像から最も有益なピクセルのみを適応的に選択 … 続きを読む
Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization
要約 Vision-Language Models(VLMS)は、最小限のラベル … 続きを読む
ABS-Mamba: SAM2-Driven Bidirectional Spiral Mamba Network for Medical Image Translation
要約 正確なマルチモーダル医療画像翻訳には、HAを採用するグローバルな解剖学的セ … 続きを読む
Anatomical Attention Alignment representation for Radiology Report Generation
要約 Automated Radiology Report Generation … 続きを読む
カテゴリー: cs.CV
Anatomical Attention Alignment representation for Radiology Report Generation はコメントを受け付けていません
Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models
要約 この研究の目的は、マルチドメインタスク増分学習〜(mtil)の問題に対処す … 続きを読む
カテゴリー: cs.CV
Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models はコメントを受け付けていません
Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation
要約 半教師の学習は、完全に監視されたアプローチの制限に対処するために、モデルの … 続きを読む
カテゴリー: cs.CV
Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation はコメントを受け付けていません
Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images
要約 実際の画像がどのように見えるかを測定することは、人工知能研究の複雑なタスク … 続きを読む
Hybrid Spiking Vision Transformer for Object Detection with Event Cameras
要約 イベントベースのオブジェクト検出は、高い時間分解能、広いダイナミックレンジ … 続きを読む
Gameplay Highlights Generation
要約 この作業では、ゲームプレイセッションから人目を引くハイライトリールを自動的 … 続きを読む
カテゴリー: cs.CV
Gameplay Highlights Generation はコメントを受け付けていません
LAMM-ViT: AI Face Detection via Layer-Aware Modulation of Region-Guided Attention
要約 AI-合成面を検出することは、重要な課題を提示します。多様な生成技術にわた … 続きを読む
カテゴリー: cs.CV
LAMM-ViT: AI Face Detection via Layer-Aware Modulation of Region-Guided Attention はコメントを受け付けていません