月別アーカイブ: 2024年5月

Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers

要約 教師なし事前トレーニングは変革的なパラダイムとして出現し、さまざまな領域で … 続きを読む

カテゴリー: cs.CV, cs.LG | Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers はコメントを受け付けていません

Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement

要約 異なる正常な背景内で病変を修復することは、ポリープ セグメンテーション モ … 続きを読む

カテゴリー: cs.CV | Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement はコメントを受け付けていません

Anticipating Object State Changes

要約 画像やビデオにおける物体の状態の変化を予測することは困難な問題であり、その … 続きを読む

カテゴリー: cs.CV | Anticipating Object State Changes はコメントを受け付けていません

Adaptive local boundary conditions to improve Deformable Image Registration

要約 目的: 医用画像処理では、多くの場合、画像誘導治療中に動きを正確に評価して … 続きを読む

カテゴリー: cs.CV, physics.med-ph | Adaptive local boundary conditions to improve Deformable Image Registration はコメントを受け付けていません

SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization

要約 メイクアップ転送は、ソース画像のアイデンティティを維持しながら、メイクアッ … 続きを読む

カテゴリー: cs.CV | SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization はコメントを受け付けていません

DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control

要約 最近、ビデオ内でカスタマイズされたコンテンツを生成することがますます注目を … 続きを読む

カテゴリー: cs.CV | DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control はコメントを受け付けていません

MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video

要約 シングルビューの衣服を着た人間の再構成は、特に人間の複雑な動作を伴うコンテ … 続きを読む

カテゴリー: cs.CV | MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video はコメントを受け付けていません

Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension

要約 身体的知覚はインテリジェント車両やロボットにとって不可欠であり、より自然な … 続きを読む

カテゴリー: cs.CV, cs.RO | Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension はコメントを受け付けていません

Frequency-Adaptive Dilated Convolution for Semantic Segmentation

要約 連続した要素間にギャップを挿入することで受容野を拡張する拡張畳み込みは、コ … 続きを読む

カテゴリー: cs.CV | Frequency-Adaptive Dilated Convolution for Semantic Segmentation はコメントを受け付けていません

A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data

要約 放射線レポートの自動作成は医師の負担を軽減し、医療リソースの地域格差を最小 … 続きを読む

カテゴリー: cs.CV | A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data はコメントを受け付けていません