月別アーカイブ: 2023年2月

DirectMHP: Direct 2D Multi-Person Head Pose Estimation with Full-range Angles

要約 既存の頭部姿勢推定 (HPE) は主に、前頭頭が事前に検出された 1 人の … 続きを読む

カテゴリー: cs.CV | DirectMHP: Direct 2D Multi-Person Head Pose Estimation with Full-range Angles はコメントを受け付けていません

Does CLIP Know My Face?

要約 さまざまなアプリケーションでの深層学習の台頭に伴い、トレーニング データの … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Does CLIP Know My Face? はコメントを受け付けていません

Understanding and Mitigating Overfitting in Prompt Tuning for Vision-Language Models

要約 CLIP などの事前トレーニング済みのビジョン言語モデル (VLM) は、 … 続きを読む

カテゴリー: cs.CV | Understanding and Mitigating Overfitting in Prompt Tuning for Vision-Language Models はコメントを受け付けていません

What do CNNs Learn in the First Layer and Why? A Linear Systems Perspective

要約 深い畳み込みニューラル ネットワーク (CNN) の最初の層で学習される表 … 続きを読む

カテゴリー: cs.CV | What do CNNs Learn in the First Layer and Why? A Linear Systems Perspective はコメントを受け付けていません

Team-DETR: Guide Queries as a Professional Team in Detection Transformers

要約 最近提案された DETR バリアントは、合理化されたプロセスと優れたパフォ … 続きを読む

カテゴリー: cs.CV | Team-DETR: Guide Queries as a Professional Team in Detection Transformers はコメントを受け付けていません

Universal Guidance for Diffusion Models

要約 典型的な拡散モデルは、特定の形式の条件付け (最も一般的にはテキスト) を … 続きを読む

カテゴリー: cs.CV, cs.LG | Universal Guidance for Diffusion Models はコメントを受け付けていません

All in Tokens: Unifying Output Space of Visual Tasks via Soft Token

要約 通常、出力空間が一連のトークンに限定される言語タスクとは異なり、視覚タスク … 続きを読む

カテゴリー: cs.AI, cs.CV | All in Tokens: Unifying Output Space of Visual Tasks via Soft Token はコメントを受け付けていません

A Comprehensive Study of Real-Time Object Detection Networks Across Multiple Domains: A Survey

要約 ディープ ニューラル ネットワーク ベースのオブジェクト検出器は継続的に進 … 続きを読む

カテゴリー: cs.AI, cs.CV | A Comprehensive Study of Real-Time Object Detection Networks Across Multiple Domains: A Survey はコメントを受け付けていません

Expressive Talking Head Video Encoding in StyleGAN2 Latent-Space

要約 ビデオの再現に関する研究の最近の進歩は有望な結果をもたらしましたが、そのア … 続きを読む

カテゴリー: cs.CV | Expressive Talking Head Video Encoding in StyleGAN2 Latent-Space はコメントを受け付けていません

Extracting Effective Subnetworks with Gumbel-Softmax

要約 大規模でパフォーマンスの高いニューラル ネットワークは、多くの場合、パラメ … 続きを読む

カテゴリー: cs.CV | Extracting Effective Subnetworks with Gumbel-Softmax はコメントを受け付けていません