月別アーカイブ: 2023年1月

Learning Trajectory-Word Alignments for Video-Language Tasks

投稿日: 2023年1月6日作成者: jarxiv

要約画像言語BERT（IL-BERT）や動画言語BERT（VDL-BERT）で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Adaptively Clustering Neighbor Elements for Image Captioning

投稿日: 2023年1月6日作成者: jarxiv

要約我々は、キャプションを生成するための新しいグローバル-ローカル変換器である … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

High-level semantic feature matters few-shot unsupervised domain adaptation

投稿日: 2023年1月6日作成者: jarxiv

要約 FS-UDA (few-shot unsupervised domain … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection

投稿日: 2023年1月6日作成者: jarxiv

要約オープンワールドオブジェクト検出（OWOD）は、より一般的かつ挑戦的な目標 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

投稿日: 2023年1月6日作成者: jarxiv

要約近年、アニメの線画の自動着色は、アニメ産業に多大な利益をもたらすことから注 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Swin MAE: Masked Autoencoders for Small Datasets

投稿日: 2023年1月6日作成者: jarxiv

要約医用画像解析における深層学習モデルの開発は、大規模かつ十分に注釈されたデー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

WPPNets and WPPFlows: The Power of Wasserstein Patch Priors for Superresolution

投稿日: 2023年1月6日作成者: jarxiv

要約画像全体の代わりに画像パッチを利用することは，画像処理における様々な問題に … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Neural Distributed Image Compression with Cross-Attention Feature Alignment

投稿日: 2023年1月6日作成者: jarxiv

要約情報理論における分散ソース符号化問題の特殊例として、相関のあるものがデコー … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

CenterLoc3D: Monocular 3D Vehicle Localization Network for Roadside Surveillance Cameras

投稿日: 2023年1月6日作成者: jarxiv

要約単眼3D車両定位は、高度道路交通システム（ITS）や協調型車両インフラシス … 続きを読む →

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

Expressive Speech-driven Facial Animation with controllable emotions

投稿日: 2023年1月6日作成者: jarxiv

要約リアルなフェイシャルアニメーションを生成することが求められていますが、その … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年1月

Learning Trajectory-Word Alignments for Video-Language Tasks

Adaptively Clustering Neighbor Elements for Image Captioning

High-level semantic feature matters few-shot unsupervised domain adaptation

CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection

Attention-Aware Anime Line Drawing Colorization

Swin MAE: Masked Autoencoders for Small Datasets

WPPNets and WPPFlows: The Power of Wasserstein Patch Priors for Superresolution

Neural Distributed Image Compression with Cross-Attention Feature Alignment

CenterLoc3D: Monocular 3D Vehicle Localization Network for Roadside Surveillance Cameras

Expressive Speech-driven Facial Animation with controllable emotions

最近の投稿

最近のコメント

アーカイブ

カテゴリー