月別アーカイブ: 2024年5月

Dual-Branch Network for Portrait Image Quality Assessment

投稿日: 2024年5月15日作成者: jarxiv

要約ポートレート画像は通常、さまざまな背景を背景にした際立った人物で構成されま … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Shape-aware synthesis of pathological lung CT scans using CycleGAN for enhanced semi-supervised lung segmentation

投稿日: 2024年5月15日作成者: jarxiv

要約この論文では、医用画像解析における重要な課題である病理学的肺のセグメンテー … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Modeling Caption Diversity in Contrastive Vision-Language Pretraining

投稿日: 2024年5月15日作成者: jarxiv

要約画像にキャプションを付ける方法は何千もあります。一方、Contrasti … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models

投稿日: 2024年5月15日作成者: jarxiv

要約 Sora の登場は、テキストからビデオへの拡散モデルの新時代を告げ、ビデオ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

DiffPoseTalk: Speech-Driven Stylistic 3D Facial Animation and Head Pose Generation via Diffusion Models

投稿日: 2024年5月15日作成者: jarxiv

要約音声によって駆動されるスタイル的な 3D 顔アニメーションの生成には、音声 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Hearing Touch: Audio-Visual Pretraining for Contact-Rich Manipulation

投稿日: 2024年5月15日作成者: jarxiv

要約大量のデータでの事前トレーニングはロボット学習にとって有益ですが、現在のパ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Local-peak scale-invariant feature transform for fast and random image stitching

投稿日: 2024年5月15日作成者: jarxiv

要約画像スティッチングは、高い空間解像度で広い視野を構築することを目的としてい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Analyzing Participants’ Engagement during Online Meetings Using Unsupervised Remote Photoplethysmography with Behavioral Features

投稿日: 2024年5月15日作成者: jarxiv

要約エンゲージメント測定は、医療、教育、サービスに応用されています。生理学的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cross-Domain Feature Augmentation for Domain Generalization

投稿日: 2024年5月15日作成者: jarxiv

要約ドメインの一般化は、分布の変化に対して堅牢なモデルを開発することを目的とし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EchoTracker: Advancing Myocardial Point Tracking in Echocardiography

投稿日: 2024年5月15日作成者: jarxiv

要約心エコー検査における組織追跡は、複雑な心臓の動きと超音波取得の固有の性質に … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年5月

Dual-Branch Network for Portrait Image Quality Assessment

Shape-aware synthesis of pathological lung CT scans using CycleGAN for enhanced semi-supervised lung segmentation

Modeling Caption Diversity in Contrastive Vision-Language Pretraining

VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models

DiffPoseTalk: Speech-Driven Stylistic 3D Facial Animation and Head Pose Generation via Diffusion Models

Hearing Touch: Audio-Visual Pretraining for Contact-Rich Manipulation

Local-peak scale-invariant feature transform for fast and random image stitching

Analyzing Participants’ Engagement during Online Meetings Using Unsupervised Remote Photoplethysmography with Behavioral Features

Cross-Domain Feature Augmentation for Domain Generalization

EchoTracker: Advancing Myocardial Point Tracking in Echocardiography

最近の投稿

最近のコメント

アーカイブ

カテゴリー