月別アーカイブ: 2024年5月

Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers

投稿日: 2024年5月22日作成者: jarxiv

要約教師なし事前トレーニングは変革的なパラダイムとして出現し、さまざまな領域で … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement

投稿日: 2024年5月22日作成者: jarxiv

要約異なる正常な背景内で病変を修復することは、ポリープセグメンテーションモ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Anticipating Object State Changes

投稿日: 2024年5月22日作成者: jarxiv

要約画像やビデオにおける物体の状態の変化を予測することは困難な問題であり、その … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Adaptive local boundary conditions to improve Deformable Image Registration

投稿日: 2024年5月22日作成者: jarxiv

要約目的: 医用画像処理では、多くの場合、画像誘導治療中に動きを正確に評価して … 続きを読む →

カテゴリー: cs.CV, physics.med-ph | コメントを受け付けていません

SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization

投稿日: 2024年5月22日作成者: jarxiv

要約メイクアップ転送は、ソース画像のアイデンティティを維持しながら、メイクアッ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control

投稿日: 2024年5月22日作成者: jarxiv

要約最近、ビデオ内でカスタマイズされたコンテンツを生成することがますます注目を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video

投稿日: 2024年5月22日作成者: jarxiv

要約シングルビューの衣服を着た人間の再構成は、特に人間の複雑な動作を伴うコンテ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension

投稿日: 2024年5月22日作成者: jarxiv

要約身体的知覚はインテリジェント車両やロボットにとって不可欠であり、より自然な … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Frequency-Adaptive Dilated Convolution for Semantic Segmentation

投稿日: 2024年5月22日作成者: jarxiv

要約連続した要素間にギャップを挿入することで受容野を拡張する拡張畳み込みは、コ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data

投稿日: 2024年5月22日作成者: jarxiv

要約放射線レポートの自動作成は医師の負担を軽減し、医療リソースの地域格差を最小 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年5月

Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers

Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement

Anticipating Object State Changes

Adaptive local boundary conditions to improve Deformable Image Registration

SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization

DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control

MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video

Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension

Frequency-Adaptive Dilated Convolution for Semantic Segmentation

A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data

最近の投稿

最近のコメント

アーカイブ

カテゴリー