月別アーカイブ: 2023年6月

Learning Domain-Aware Detection Head with Prompt Tuning

投稿日: 2023年6月12日作成者: jarxiv

要約ドメイン適応型オブジェクト検出 (DAOD) は、アノテーション付きのソー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Surface Statistics: Scene Representations in a Latent Diffusion Model

投稿日: 2023年6月12日作成者: jarxiv

要約潜在拡散モデル (LDM) は、リアルな画像を生成する優れた能力を示します … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Two Independent Teachers are Better Role Model

投稿日: 2023年6月12日作成者: jarxiv

要約最近の深層学習モデルは、幼児の脳分析において大きな注目を集めています。こ … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

DocAligner: Annotating Real-world Photographic Document Images by Simply Taking Pictures

投稿日: 2023年6月12日作成者: jarxiv

要約最近、写真シナリオにおける文書画像の分析と認識に関する研究への関心が高まっ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ViT-CX: Causal Explanation of Vision Transformers

投稿日: 2023年6月12日作成者: jarxiv

要約 Vision Transformers (ViT) と eXplainab … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Self-Distillation for Further Pre-training of Transformers

投稿日: 2023年6月12日作成者: jarxiv

要約大量のラベルなしデータで大規模な変換モデルを事前トレーニングし、さまざまな … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers

投稿日: 2023年6月12日作成者: jarxiv

要約表現学習と特徴のもつれの解き方は、最近、顔の表情認識において多くの研究の関 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Boosted Model Ensembling Approach to Ball Action Spotting in Videos: The Runner-Up Solution to CVPR’23 SoccerNet Challenge

投稿日: 2023年6月12日作成者: jarxiv

要約この技術レポートでは、ボールアクションスポッティングに対する当社のソリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

No-Reference Point Cloud Quality Assessment via Weighted Patch Quality Prediction

投稿日: 2023年6月12日作成者: jarxiv

要約点群に基づく 3D ビジョンアプリケーションの急速な開発に伴い、点群品質 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt

投稿日: 2023年6月12日作成者: jarxiv

要約拡散モデルは、コンテンツを作成し、画像分類などのタスク用のデータを生成する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年6月

Learning Domain-Aware Detection Head with Prompt Tuning

Beyond Surface Statistics: Scene Representations in a Latent Diffusion Model

Two Independent Teachers are Better Role Model

DocAligner: Annotating Real-world Photographic Document Images by Simply Taking Pictures

ViT-CX: Causal Explanation of Vision Transformers

Self-Distillation for Further Pre-training of Transformers

Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers

A Boosted Model Ensembling Approach to Ball Action Spotting in Videos: The Runner-Up Solution to CVPR’23 SoccerNet Challenge

No-Reference Point Cloud Quality Assessment via Weighted Patch Quality Prediction

Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt

最近の投稿

最近のコメント

アーカイブ

カテゴリー