月別アーカイブ: 2023年6月

Learning Domain-Aware Detection Head with Prompt Tuning

要約 ドメイン適応型オブジェクト検出 (DAOD) は、アノテーション付きのソー … 続きを読む

カテゴリー: cs.CV | Learning Domain-Aware Detection Head with Prompt Tuning はコメントを受け付けていません

Beyond Surface Statistics: Scene Representations in a Latent Diffusion Model

要約 潜在拡散モデル (LDM) は、リアルな画像を生成する優れた能力を示します … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Beyond Surface Statistics: Scene Representations in a Latent Diffusion Model はコメントを受け付けていません

Two Independent Teachers are Better Role Model

要約 最近の深層学習モデルは、幼児の脳分析において大きな注目を集めています。 こ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Two Independent Teachers are Better Role Model はコメントを受け付けていません

DocAligner: Annotating Real-world Photographic Document Images by Simply Taking Pictures

要約 最近、写真シナリオにおける文書画像の分析と認識に関する研究への関心が高まっ … 続きを読む

カテゴリー: cs.CV | DocAligner: Annotating Real-world Photographic Document Images by Simply Taking Pictures はコメントを受け付けていません

ViT-CX: Causal Explanation of Vision Transformers

要約 Vision Transformers (ViT) と eXplainab … 続きを読む

カテゴリー: cs.AI, cs.CV | ViT-CX: Causal Explanation of Vision Transformers はコメントを受け付けていません

Self-Distillation for Further Pre-training of Transformers

要約 大量のラベルなしデータで大規模な変換モデルを事前トレーニングし、さまざまな … 続きを読む

カテゴリー: cs.CV, cs.LG | Self-Distillation for Further Pre-training of Transformers はコメントを受け付けていません

Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers

要約 表現学習と特徴のもつれの解き方は、最近、顔の表情認識において多くの研究の関 … 続きを読む

カテゴリー: cs.CV | Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers はコメントを受け付けていません

A Boosted Model Ensembling Approach to Ball Action Spotting in Videos: The Runner-Up Solution to CVPR’23 SoccerNet Challenge

要約 この技術レポートでは、ボール アクション スポッティングに対する当社のソリ … 続きを読む

カテゴリー: cs.CV | A Boosted Model Ensembling Approach to Ball Action Spotting in Videos: The Runner-Up Solution to CVPR’23 SoccerNet Challenge はコメントを受け付けていません

No-Reference Point Cloud Quality Assessment via Weighted Patch Quality Prediction

要約 点群に基づく 3D ビジョン アプリケーションの急速な開発に伴い、点群品質 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | No-Reference Point Cloud Quality Assessment via Weighted Patch Quality Prediction はコメントを受け付けていません

Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt

要約 拡散モデルは、コンテンツを作成し、画像分類などのタスク用のデータを生成する … 続きを読む

カテゴリー: cs.AI, cs.CV | Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt はコメントを受け付けていません