月別アーカイブ: 2024年3月

Generic 3D Diffusion Adapter Using Controlled Multi-View Editing

要約 オープンドメインの 3D オブジェクト合成は、データが限られていて計算が複 … 続きを読む

カテゴリー: cs.CV, cs.GR | Generic 3D Diffusion Adapter Using Controlled Multi-View Editing はコメントを受け付けていません

MEDBind: Unifying Language and Multimodal Medical Data Embeddings

要約 医療視覚言語事前トレーニング モデル (VLPM) は、胸部 X 線 (C … 続きを読む

カテゴリー: cs.CV | MEDBind: Unifying Language and Multimodal Medical Data Embeddings はコメントを受け付けていません

mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding

要約 構造情報は、文書、表、グラフなどのテキストの多い画像のセマンティクスを理解 … 続きを読む

カテゴリー: cs.CV | mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding はコメントを受け付けていません

SynCDR : Training Cross Domain Retrieval Models with Synthetic Data

要約 クロスドメイン検索では、2 つの視覚ドメインにわたって同じ意味カテゴリから … 続きを読む

カテゴリー: cs.AI, cs.CV | SynCDR : Training Cross Domain Retrieval Models with Synthetic Data はコメントを受け付けていません

TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation

要約 適切に展開された UV を取得することが難しいため、セマンティック UV … 続きを読む

カテゴリー: cs.CV | TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation はコメントを受け付けていません

Self-Supervised Learning for Image Super-Resolution and Deblurring

要約 自己教師あり手法は、さまざまなイメージング逆問題において教師あり手法とほぼ … 続きを読む

カテゴリー: cs.CV, eess.IV | Self-Supervised Learning for Image Super-Resolution and Deblurring はコメントを受け付けていません

Vertical Federated Image Segmentation

要約 画像ベースの問題に対する AI ソリューションの普及に伴い、データのプライ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, I.2.8 | Vertical Federated Image Segmentation はコメントを受け付けていません

Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model

要約 超高解像度画像合成用に設計された新しいアーキテクチャであるピラミッド拡散モ … 続きを読む

カテゴリー: cs.CV | Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model はコメントを受け付けていません

Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition

要約 大規模な視覚言語の事前トレーニング済みモデルは、さまざまなビデオ タスクで … 続きを読む

カテゴリー: cs.AI, cs.CV | Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition はコメントを受け付けていません

Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling

要約 顔表情認識 (FER) は、コンピュータ ビジョンにおいて重要な役割を果た … 続きを読む

カテゴリー: cs.AI, cs.CV | Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling はコメントを受け付けていません