月別アーカイブ: 2022年8月

Metadata-enhanced contrastive learning from retinal optical coherence tomography images

要約 教師あり深層学習アルゴリズムは、医療画像のスクリーニング、モニタリング、グ … 続きを読む

カテゴリー: cs.CV | Metadata-enhanced contrastive learning from retinal optical coherence tomography images はコメントを受け付けていません

MVSFormer: Learning Robust Image Representations via Transformers and Temperature-based Depth for Multi-View Stereo

要約 特徴表現学習は、学習型マルチビューステレオ(MVS)の重要なレシピである。 … 続きを読む

カテゴリー: cs.CV | MVSFormer: Learning Robust Image Representations via Transformers and Temperature-based Depth for Multi-View Stereo はコメントを受け付けていません

On the Connection between Local Attention and Dynamic Depth-wise Convolution

要約 Vision Transformer(ViT)は、視覚認識において最先端の … 続きを読む

カテゴリー: cs.CV | On the Connection between Local Attention and Dynamic Depth-wise Convolution はコメントを受け付けていません

Multi-modal volumetric concept activation to explain detection and classification of metastatic prostate cancer on PSMA-PET/CT

要約 ニューラルネットワークの挙動を解析するために、説明可能な人工知能(XAI) … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-modal volumetric concept activation to explain detection and classification of metastatic prostate cancer on PSMA-PET/CT はコメントを受け付けていません

Privacy-Preserving Image Classification Using ConvMixer with Adaptive Permutation Matrix

要約 本論文では、ConvMixer構造の利用下で暗号化画像を用いたプライバシー … 続きを読む

カテゴリー: cs.CR, cs.CV | Privacy-Preserving Image Classification Using ConvMixer with Adaptive Permutation Matrix はコメントを受け付けていません

Constructing Balance from Imbalance for Long-tailed Image Recognition

要約 ロングテール画像認識では、多数(ヘッド)クラスと少数(テール)クラスの間の … 続きを読む

カテゴリー: cs.CV, cs.LG | Constructing Balance from Imbalance for Long-tailed Image Recognition はコメントを受け付けていません

Glance and Focus Networks for Dynamic Visual Recognition

要約 視覚認識タスクには空間的な冗長性が広く存在する。すなわち、画像やビデオフレ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Glance and Focus Networks for Dynamic Visual Recognition はコメントを受け付けていません

SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset

要約 マルチオブジェクト・トラッキング(MOT)は、過去10年間、検出に関する畳 … 続きを読む

カテゴリー: cs.CV | SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset はコメントを受け付けていません

Surgical Skill Assessment via Video Semantic Aggregation

要約 手術スキルのビデオベースの自動評価は、特にリソースの乏しい地域における若い … 続きを読む

カテゴリー: cs.CV | Surgical Skill Assessment via Video Semantic Aggregation はコメントを受け付けていません

Semantic Interleaving Global Channel Attention for Multilabel Remote Sensing Image Classification

要約 マルチラベルによるリモートセンシング画像分類(MLRSIC)の研究が盛んに … 続きを読む

カテゴリー: cs.CV | Semantic Interleaving Global Channel Attention for Multilabel Remote Sensing Image Classification はコメントを受け付けていません