cs.CV」カテゴリーアーカイブ

Extending SEEDS to a Supervoxel Algorithm for Medical Image Analysis

要約 この研究では、SEEDSスーパーピクセルアルゴリズムを2D画像から3Dボリ … 続きを読む

カテゴリー: cs.CV | Extending SEEDS to a Supervoxel Algorithm for Medical Image Analysis はコメントを受け付けていません

GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising

要約 Generative Adversarial Networks(GAN)は … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising はコメントを受け付けていません

DCBM: Data-Efficient Visual Concept Bottleneck Models

要約 概念ボトルネックモデル(CBM)は、人間が理解可能な概念に基づいて予測を行 … 続きを読む

カテゴリー: cs.CV | DCBM: Data-Efficient Visual Concept Bottleneck Models はコメントを受け付けていません

A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda

要約 本研究では、CVPR-2023においてGillertらによって提案されたI … 続きを読む

カテゴリー: cs.CV, q-bio.QM | A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda はコメントを受け付けていません

SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images

要約 連合学習パラダイムにおける自己教師付き学習は、ラベル付けされていない孤立し … 続きを読む

カテゴリー: cs.CV, cs.LG | SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images はコメントを受け付けていません

TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes

要約 TUMTraffic-VideoQAは、複雑な道路交通シナリオにおける時空 … 続きを読む

カテゴリー: cs.CV | TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes はコメントを受け付けていません

Personalization Toolkit: Training Free Personalization of Large Vision Language Models

要約 ラージビジョン言語モデル(LVLM)は、個々のユーザーのユニークなニーズや … 続きを読む

カテゴリー: cs.CV | Personalization Toolkit: Training Free Personalization of Large Vision Language Models はコメントを受け付けていません

IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning

要約 SA-1Bの膨大な学習データを用いたセグメント何でもモデル(SAM)は、卓 … 続きを読む

カテゴリー: cs.CV | IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning はコメントを受け付けていません

SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency

要約 マルチモーダル大規模言語モデル(MLLM)は主に2つのアーキテクチャに分類 … 続きを読む

カテゴリー: cs.CL, cs.CV | SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency はコメントを受け付けていません

Towards Consistent and Controllable Image Synthesis for Face Editing

要約 現在の顔編集手法は主にGANベースの手法に依存しているが、最近では画像再構 … 続きを読む

カテゴリー: cs.CV | Towards Consistent and Controllable Image Synthesis for Face Editing はコメントを受け付けていません