「cs.MM」カテゴリーアーカイブ

Generating More Pertinent Captions by Leveraging Semantics and Style on Multi-Source Datasets

投稿日: 2023年12月1日作成者: jarxiv

要約この論文では、人間が注釈を付けたキャプションと Web で収集したキャプシ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Multi-task learning with cross-task consistency for improved depth estimation in colonoscopy

投稿日: 2023年12月1日作成者: jarxiv

要約結腸内視鏡検査スクリーニングは、潰瘍や癌性ポリープなどの結腸と直腸の異常を … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Automated interpretation of congenital heart disease from multi-view echocardiograms

投稿日: 2023年12月1日作成者: jarxiv

要約先天性心疾患（CHD）は、中国で最も一般的な先天異常であり、新生児死亡の主 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV, physics.med-ph | コメントを受け付けていません

Motion-Conditioned Image Animation for Video Editing

投稿日: 2023年12月1日作成者: jarxiv

要約ビデオ編集のためのモーションコンディショニングされたイメージアニメーショ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.MM | コメントを受け付けていません

VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models

投稿日: 2023年12月1日作成者: jarxiv

要約拡散モデルは、画像とビデオの生成において大きな成功を収めています。これに … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes

投稿日: 2023年11月30日作成者: jarxiv

要約ディープフェイク検出の課題は、音声や視覚の研究者によって解決されるには程遠 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS, I.2.10 | コメントを受け付けていません

BAND-2k: Banding Artifact Noticeable Database for Banding Detection and Quality Assessment

投稿日: 2023年11月30日作成者: jarxiv

要約階段状の輪郭とも呼ばれるバンディングは、圧縮アルゴリズムまたは量子化アルゴ … 続きを読む →

カテゴリー: cs.CV, cs.DB, cs.MM | コメントを受け付けていません

Cinematic Behavior Transfer via NeRF-based Differentiable Filming

投稿日: 2023年11月30日作成者: jarxiv

要約デジタルメディアとビデオ制作の進化する状況では、カメラの動きやキャラクタ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.HC, cs.MM | コメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Accurate Speech Emotion Recognition

投稿日: 2023年11月27日作成者: jarxiv

要約対照的クロスモダリティ事前トレーニングは、最近さまざまな分野で目覚ましい成 … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

CASR: Refining Action Segmentation via Magrinalizing Frame-levle Causal Relationships

投稿日: 2023年11月27日作成者: jarxiv

要約ディープラーニングと因果関係発見を統合することで、Temporal Act … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Generating More Pertinent Captions by Leveraging Semantics and Style on Multi-Source Datasets

Multi-task learning with cross-task consistency for improved depth estimation in colonoscopy

Automated interpretation of congenital heart disease from multi-view echocardiograms

Motion-Conditioned Image Animation for Video Editing

VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models

Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes

BAND-2k: Banding Artifact Noticeable Database for Banding Detection and Quality Assessment

Cinematic Behavior Transfer via NeRF-based Differentiable Filming

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Accurate Speech Emotion Recognition

CASR: Refining Action Segmentation via Magrinalizing Frame-levle Causal Relationships

最近の投稿

最近のコメント

アーカイブ

カテゴリー