投稿者「jarxiv」のアーカイブ

Hierarchical Sparse Attention Framework for Computationally Efficient Classification of Biological Cells

要約 Sparseattnnetは、画像から最も有益なピクセルのみを適応的に選択 … 続きを読む

カテゴリー: cs.CV, eess.IV | Hierarchical Sparse Attention Framework for Computationally Efficient Classification of Biological Cells はコメントを受け付けていません

Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization

要約 Vision-Language Models(VLMS)は、最小限のラベル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization はコメントを受け付けていません

ABS-Mamba: SAM2-Driven Bidirectional Spiral Mamba Network for Medical Image Translation

要約 正確なマルチモーダル医療画像翻訳には、HAを採用するグローバルな解剖学的セ … 続きを読む

カテゴリー: cs.CV, eess.IV | ABS-Mamba: SAM2-Driven Bidirectional Spiral Mamba Network for Medical Image Translation はコメントを受け付けていません

Anatomical Attention Alignment representation for Radiology Report Generation

要約 Automated Radiology Report Generation … 続きを読む

カテゴリー: cs.CV | Anatomical Attention Alignment representation for Radiology Report Generation はコメントを受け付けていません

Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models

要約 この研究の目的は、マルチドメインタスク増分学習〜(mtil)の問題に対処す … 続きを読む

カテゴリー: cs.CV | Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models はコメントを受け付けていません

Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation

要約 半教師の学習は、完全に監視されたアプローチの制限に対処するために、モデルの … 続きを読む

カテゴリー: cs.CV | Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation はコメントを受け付けていません

Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images

要約 実際の画像がどのように見えるかを測定することは、人工知能研究の複雑なタスク … 続きを読む

カテゴリー: cs.CL, cs.CV | Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images はコメントを受け付けていません

Hybrid Spiking Vision Transformer for Object Detection with Event Cameras

要約 イベントベースのオブジェクト検出は、高い時間分解能、広いダイナミックレンジ … 続きを読む

カテゴリー: cs.AI, cs.CV | Hybrid Spiking Vision Transformer for Object Detection with Event Cameras はコメントを受け付けていません

Gameplay Highlights Generation

要約 この作業では、ゲームプレイセッションから人目を引くハイライトリールを自動的 … 続きを読む

カテゴリー: cs.CV | Gameplay Highlights Generation はコメントを受け付けていません

LAMM-ViT: AI Face Detection via Layer-Aware Modulation of Region-Guided Attention

要約 AI-合成面を検出することは、重要な課題を提示します。多様な生成技術にわた … 続きを読む

カテゴリー: cs.CV | LAMM-ViT: AI Face Detection via Layer-Aware Modulation of Region-Guided Attention はコメントを受け付けていません