月別アーカイブ: 2023年5月

PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering

要約 この論文では、重要な臨床関連情報を含む医用画像を効率的に解釈する上で重要な … 続きを読む

カテゴリー: cs.CV | PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering はコメントを受け付けていません

Rethinking the Evaluation Protocol of Domain Generalization

要約 ドメインの一般化は、複数のトレーニング ドメインから学習した共通の知識を活 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Rethinking the Evaluation Protocol of Domain Generalization はコメントを受け付けていません

PopulAtion Parameter Averaging (PAPA)

要約 アンサンブル手法は複数のモデルの予測を組み合わせてパフォーマンスを向上させ … 続きを読む

カテゴリー: cs.CV, cs.LG | PopulAtion Parameter Averaging (PAPA) はコメントを受け付けていません

Reversible Graph Neural Network-based Reaction Distribution Learning for Multiple Appropriate Facial Reactions Generation

要約 人間と人間の二者関係における顔の反応の生成は複雑であり、話者の行動には複数 … 続きを読む

カテゴリー: 68T40, cs.CV | Reversible Graph Neural Network-based Reaction Distribution Learning for Multiple Appropriate Facial Reactions Generation はコメントを受け付けていません

ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers

要約 最近、プレーン ビジョン トランスフォーマー (ViT) は、強力なモデリ … 続きを読む

カテゴリー: cs.CV | ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers はコメントを受け付けていません

CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Natural Language

要約 最近の研究では、自然言語を使用して 3D 形状を生成および編集できることが … 続きを読む

カテゴリー: cs.AI, cs.CV | CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Natural Language はコメントを受け付けていません

High Speed Human Action Recognition using a Photonic Reservoir Computer

要約 ビデオ内の人間の動作の認識は、コンピューター ビジョンの最も活発な研究分野 … 続きを読む

カテゴリー: cs.CV, cs.ET, physics.optics | High Speed Human Action Recognition using a Photonic Reservoir Computer はコメントを受け付けていません

Rethinking Semi-Supervised Medical Image Segmentation: A Variance-Reduction Perspective

要約 医用画像のセグメンテーションでは、意味的に類似したサンプルと異なるサンプル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Rethinking Semi-Supervised Medical Image Segmentation: A Variance-Reduction Perspective はコメントを受け付けていません

ZITS++: Image Inpainting by Improving the Incremental Transformer on Structural Priors

要約 画像の修復には、破損した画像の欠落領域を埋めることが含まれます。 最近目覚 … 続きを読む

カテゴリー: cs.CV | ZITS++: Image Inpainting by Improving the Incremental Transformer on Structural Priors はコメントを受け付けていません

MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation

要約 テキストから画像への拡散モデル (DM) の最近の人気は、DM がユーザー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation はコメントを受け付けていません