月別アーカイブ: 2024年5月

Dual-Branch Network for Portrait Image Quality Assessment

要約 ポートレート画像は通常、さまざまな背景を背景にした際立った人物で構成されま … 続きを読む

カテゴリー: cs.CV, cs.MM | Dual-Branch Network for Portrait Image Quality Assessment はコメントを受け付けていません

Shape-aware synthesis of pathological lung CT scans using CycleGAN for enhanced semi-supervised lung segmentation

要約 この論文では、医用画像解析における重要な課題である病理学的肺のセグメンテー … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Shape-aware synthesis of pathological lung CT scans using CycleGAN for enhanced semi-supervised lung segmentation はコメントを受け付けていません

Modeling Caption Diversity in Contrastive Vision-Language Pretraining

要約 画像にキャプションを付ける方法は何千もあります。 一方、Contrasti … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Modeling Caption Diversity in Contrastive Vision-Language Pretraining はコメントを受け付けていません

VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models

要約 Sora の登場は、テキストからビデオへの拡散モデルの新時代を告げ、ビデオ … 続きを読む

カテゴリー: cs.CL, cs.CV | VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models はコメントを受け付けていません

DiffPoseTalk: Speech-Driven Stylistic 3D Facial Animation and Head Pose Generation via Diffusion Models

要約 音声によって駆動されるスタイル的な 3D 顔アニメーションの生成には、音声 … 続きを読む

カテゴリー: cs.CV, cs.GR | DiffPoseTalk: Speech-Driven Stylistic 3D Facial Animation and Head Pose Generation via Diffusion Models はコメントを受け付けていません

Hearing Touch: Audio-Visual Pretraining for Contact-Rich Manipulation

要約 大量のデータでの事前トレーニングはロボット学習にとって有益ですが、現在のパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Hearing Touch: Audio-Visual Pretraining for Contact-Rich Manipulation はコメントを受け付けていません

Local-peak scale-invariant feature transform for fast and random image stitching

要約 画像スティッチングは、高い空間解像度で広い視野を構築することを目的としてい … 続きを読む

カテゴリー: cs.CV | Local-peak scale-invariant feature transform for fast and random image stitching はコメントを受け付けていません

Analyzing Participants’ Engagement during Online Meetings Using Unsupervised Remote Photoplethysmography with Behavioral Features

要約 エンゲージメント測定は、医療、教育、サービスに応用されています。 生理学的 … 続きを読む

カテゴリー: cs.CV | Analyzing Participants’ Engagement during Online Meetings Using Unsupervised Remote Photoplethysmography with Behavioral Features はコメントを受け付けていません

Cross-Domain Feature Augmentation for Domain Generalization

要約 ドメインの一般化は、分布の変化に対して堅牢なモデルを開発することを目的とし … 続きを読む

カテゴリー: cs.CV | Cross-Domain Feature Augmentation for Domain Generalization はコメントを受け付けていません

EchoTracker: Advancing Myocardial Point Tracking in Echocardiography

要約 心エコー検査における組織追跡は、複雑な心臓の動きと超音波取得の固有の性質に … 続きを読む

カテゴリー: cs.AI, cs.CV | EchoTracker: Advancing Myocardial Point Tracking in Echocardiography はコメントを受け付けていません