月別アーカイブ: 2023年8月

Evaluating the Quality and Diversity of DCGAN-based Generatively Synthesized Diabetic Retinopathy Imagery

要約 公的に利用可能な糖尿病性網膜症 (DR) データセットは不均衡であり、DR … 続きを読む

カテゴリー: cs.CV, eess.IV | Evaluating the Quality and Diversity of DCGAN-based Generatively Synthesized Diabetic Retinopathy Imagery はコメントを受け付けていません

BinaryViT: Towards Efficient and Accurate Binary Vision Transformers

要約 ビジョン トランスフォーマー (ViT) は、ほとんどのコンピューター ビ … 続きを読む

カテゴリー: cs.CV | BinaryViT: Towards Efficient and Accurate Binary Vision Transformers はコメントを受け付けていません

SegViTv2: Exploring Efficient and Continual Semantic Segmentation with Plain Vision Transformers

要約 この論文では、エンコーダ/デコーダ フレームワークを使用したセマンティック … 続きを読む

カテゴリー: cs.CV | SegViTv2: Exploring Efficient and Continual Semantic Segmentation with Plain Vision Transformers はコメントを受け付けていません

Topology-aware MLP for Skeleton-based Action Recognition

要約 グラフ畳み込みネットワーク (GCN) は、スケルトンベースのアクション認 … 続きを読む

カテゴリー: cs.CV | Topology-aware MLP for Skeleton-based Action Recognition はコメントを受け付けていません

MB-TaylorFormer: Multi-branch Efficient Transformer Expanded by Taylor Formula for Image Dehazing

要約 近年、Transformer ネットワークは、そのグローバルな受容野と入力 … 続きを読む

カテゴリー: cs.CV | MB-TaylorFormer: Multi-branch Efficient Transformer Expanded by Taylor Formula for Image Dehazing はコメントを受け付けていません

How Good is Google Bard’s Visual Understanding? An Empirical Study on Open Challenges

要約 Google の Bard は、会話型 AI の分野で OpenAI の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | How Good is Google Bard’s Visual Understanding? An Empirical Study on Open Challenges はコメントを受け付けていません

Nonrigid Object Contact Estimation With Regional Unwrapping Transformer

要約 手と非剛体物体との間の接触パターンを取得することは、視覚およびロボット工学 … 続きを読む

カテゴリー: cs.CV | Nonrigid Object Contact Estimation With Regional Unwrapping Transformer はコメントを受け付けていません

Fault Localization for Buggy Deep Learning Framework Conversions in Image Recognition

要約 ディープ ニューラル ネットワーク (DNN) をデプロイする場合、開発者 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SE, cs.SY, eess.SY | Fault Localization for Buggy Deep Learning Framework Conversions in Image Recognition はコメントを受け付けていません

Discriminator-free Unsupervised Domain Adaptation for Multi-label Image Classification

要約 この論文では、DDA-MLIC と呼ばれるマルチラベル画像分類 (MLIC … 続きを読む

カテゴリー: cs.CV | Discriminator-free Unsupervised Domain Adaptation for Multi-label Image Classification はコメントを受け付けていません

From Pixels to Portraits: A Comprehensive Survey of Talking Head Generation Techniques and Applications

要約 ディープラーニングとコンピュータービジョンの最近の進歩により、現実的なトー … 続きを読む

カテゴリー: cs.CV | From Pixels to Portraits: A Comprehensive Survey of Talking Head Generation Techniques and Applications はコメントを受け付けていません