月別アーカイブ: 2023年1月

Learning Trajectory-Word Alignments for Video-Language Tasks

要約 画像言語BERT(IL-BERT)や動画言語BERT(VDL-BERT)で … 続きを読む

カテゴリー: cs.CV | Learning Trajectory-Word Alignments for Video-Language Tasks はコメントを受け付けていません

Adaptively Clustering Neighbor Elements for Image Captioning

要約 我々は、キャプションを生成するための新しいグローバル-ローカル変換器である … 続きを読む

カテゴリー: cs.CV | Adaptively Clustering Neighbor Elements for Image Captioning はコメントを受け付けていません

High-level semantic feature matters few-shot unsupervised domain adaptation

要約 FS-UDA (few-shot unsupervised domain … 続きを読む

カテゴリー: cs.CV | High-level semantic feature matters few-shot unsupervised domain adaptation はコメントを受け付けていません

CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection

要約 オープンワールドオブジェクト検出(OWOD)は、より一般的かつ挑戦的な目標 … 続きを読む

カテゴリー: cs.CV | CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection はコメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

要約 近年、アニメの線画の自動着色は、アニメ産業に多大な利益をもたらすことから注 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Attention-Aware Anime Line Drawing Colorization はコメントを受け付けていません

Swin MAE: Masked Autoencoders for Small Datasets

要約 医用画像解析における深層学習モデルの開発は、大規模かつ十分に注釈されたデー … 続きを読む

カテゴリー: cs.AI, cs.CV | Swin MAE: Masked Autoencoders for Small Datasets はコメントを受け付けていません

WPPNets and WPPFlows: The Power of Wasserstein Patch Priors for Superresolution

要約 画像全体の代わりに画像パッチを利用することは,画像処理における様々な問題に … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | WPPNets and WPPFlows: The Power of Wasserstein Patch Priors for Superresolution はコメントを受け付けていません

Neural Distributed Image Compression with Cross-Attention Feature Alignment

要約 情報理論における分散ソース符号化問題の特殊例として、相関のあるものがデコー … 続きを読む

カテゴリー: cs.CV, eess.IV | Neural Distributed Image Compression with Cross-Attention Feature Alignment はコメントを受け付けていません

CenterLoc3D: Monocular 3D Vehicle Localization Network for Roadside Surveillance Cameras

要約 単眼3D車両定位は、高度道路交通システム(ITS)や協調型車両インフラシス … 続きを読む

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, I.2.10 | CenterLoc3D: Monocular 3D Vehicle Localization Network for Roadside Surveillance Cameras はコメントを受け付けていません

Expressive Speech-driven Facial Animation with controllable emotions

要約 リアルなフェイシャルアニメーションを生成することが求められていますが、その … 続きを読む

カテゴリー: cs.CV | Expressive Speech-driven Facial Animation with controllable emotions はコメントを受け付けていません