月別アーカイブ: 2023年5月

CLUSTSEG: Clustering for Universal Segmentation

要約 我々は、統合されたニューラル クラスタリング スキームを通じてさまざまな画 … 続きを読む

カテゴリー: cs.CV | CLUSTSEG: Clustering for Universal Segmentation はコメントを受け付けていません

DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image Generation

要約 主題主導のテキストから画像への生成は、テキストの説明に基づいて特定の主題の … 続きを読む

カテゴリー: cs.CV | DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image Generation はコメントを受け付けていません

NODE-ImgNet: a PDE-informed effective and robust model for image denoising

要約 画像ノイズ除去のための従来の偏微分方程式 (PDE) アプローチからインス … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | NODE-ImgNet: a PDE-informed effective and robust model for image denoising はコメントを受け付けていません

A Comparative Study of Face Detection Algorithms for Masked Face Detection

要約 現代の顔検出アルゴリズムは、ポーズ、照明、スケールの変化など、多くの課題に … 続きを読む

カテゴリー: cs.CV, cs.LG | A Comparative Study of Face Detection Algorithms for Masked Face Detection はコメントを受け付けていません

A Study on Transformer Configuration and Training Objective

要約 Transformer ベースのモデルは、多くのタスク、特に視覚と言語のタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | A Study on Transformer Configuration and Training Objective はコメントを受け付けていません

Inspecting the Geographical Representativeness of Images from Text-to-Image Models

要約 生成モデルの最近の進歩により、ほとんどのテキスト入力に対して現実的な画像と … 続きを読む

カテゴリー: cs.CL, cs.CV | Inspecting the Geographical Representativeness of Images from Text-to-Image Models はコメントを受け付けていません

Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces

要約 一般的な生成拡散モデルは、ガウス拡散プロセスに依存して逆方向変換をトレーニ … 続きを読む

カテゴリー: cs.CV, cs.LG | Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces はコメントを受け付けていません

Universal Domain Adaptation from Foundation Models

要約 基盤モデル (CLIP や DINOv2 など) は、大規模なデータ コー … 続きを読む

カテゴリー: cs.CV, cs.LG | Universal Domain Adaptation from Foundation Models はコメントを受け付けていません

QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation

要約 人間の動作にはランダムなジッターがあるため、音声駆動のジェスチャ生成は非常 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM, cs.SD, eess.AS | QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation はコメントを受け付けていません

XFormer: Fast and Accurate Monocular 3D Body Capture

要約 単眼画像のみを入力として消費者向け CPU 上でリアルタイム パフォーマン … 続きを読む

カテゴリー: cs.CV | XFormer: Fast and Accurate Monocular 3D Body Capture はコメントを受け付けていません