cs.CV」カテゴリーアーカイブ

Neural Brain: A Neuroscience-inspired Framework for Embodied Agents

要約 人工知能(AI)の急速な進化は、静的なデータ駆動型モデルから、実際の環境を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Neural Brain: A Neuroscience-inspired Framework for Embodied Agents はコメントを受け付けていません

ShotAdapter: Text-to-Multi-Shot Video Generation with Diffusion Models

要約 現在の拡散ベースのテキストからビデオへのメソッドは、単一ショットの短いビデ … 続きを読む

カテゴリー: cs.CV | ShotAdapter: Text-to-Multi-Shot Video Generation with Diffusion Models はコメントを受け付けていません

Breast Cancer Classification in Deep Ultraviolet Fluorescence Images Using a Patch-Level Vision Transformer Framework

要約 乳房を消費する手術(BCS)は、健康な組織保存を最大化しながら、悪性病変を … 続きを読む

カテゴリー: cs.CV, eess.IV | Breast Cancer Classification in Deep Ultraviolet Fluorescence Images Using a Patch-Level Vision Transformer Framework はコメントを受け付けていません

Introducing Unbiased Depth into 2D Gaussian Splatting for High-accuracy Surface Reconstruction

要約 最近、2D Gaussian Splatting(2DGS)は、2Dサーフ … 続きを読む

カテゴリー: cs.CV | Introducing Unbiased Depth into 2D Gaussian Splatting for High-accuracy Surface Reconstruction はコメントを受け付けていません

Hierarchical Sparse Attention Framework for Computationally Efficient Classification of Biological Cells

要約 Sparseattnnetは、画像から最も有益なピクセルのみを適応的に選択 … 続きを読む

カテゴリー: cs.CV, eess.IV | Hierarchical Sparse Attention Framework for Computationally Efficient Classification of Biological Cells はコメントを受け付けていません

Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization

要約 Vision-Language Models(VLMS)は、最小限のラベル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization はコメントを受け付けていません

ABS-Mamba: SAM2-Driven Bidirectional Spiral Mamba Network for Medical Image Translation

要約 正確なマルチモーダル医療画像翻訳には、HAを採用するグローバルな解剖学的セ … 続きを読む

カテゴリー: cs.CV, eess.IV | ABS-Mamba: SAM2-Driven Bidirectional Spiral Mamba Network for Medical Image Translation はコメントを受け付けていません

Anatomical Attention Alignment representation for Radiology Report Generation

要約 Automated Radiology Report Generation … 続きを読む

カテゴリー: cs.CV | Anatomical Attention Alignment representation for Radiology Report Generation はコメントを受け付けていません

Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models

要約 この研究の目的は、マルチドメインタスク増分学習〜(mtil)の問題に対処す … 続きを読む

カテゴリー: cs.CV | Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models はコメントを受け付けていません

Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation

要約 半教師の学習は、完全に監視されたアプローチの制限に対処するために、モデルの … 続きを読む

カテゴリー: cs.CV | Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation はコメントを受け付けていません