月別アーカイブ: 2025年2月

Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation

要約 オーディオ駆動のトーキングヘッド生成のための新しいフレームワークであるディ … 続きを読む

カテゴリー: cs.CV | Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation はコメントを受け付けていません

Modeling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection

要約 マルチラベル少数のショット画像分類(ML-FSIC)の目的は、各ラベルに少 … 続きを読む

カテゴリー: cs.CV | Modeling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection はコメントを受け付けていません

Motion-Robust T2* Quantification from Gradient Echo MRI with Physics-Informed Deep Learning

要約 目的:勾配エコーからのT2*の定量化磁気共鳴画像法は、運動の影響を受け、信 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph | Motion-Robust T2* Quantification from Gradient Echo MRI with Physics-Informed Deep Learning はコメントを受け付けていません

A Two-step Linear Mixing Model for Unmixing under Hyperspectral Variability

要約 スペクトルアンミキシングは、ハイパースペクトル画像処理の研究分野で重要なタ … 続きを読む

カテゴリー: cs.CV, eess.IV | A Two-step Linear Mixing Model for Unmixing under Hyperspectral Variability はコメントを受け付けていません

ELFS: Label-Free Coreset Selection with Proxy Training Dynamics

要約 高品質のヒトが注目したデータは、最新の深い学習パイプラインにとって重要です … 続きを読む

カテゴリー: cs.AI, cs.CV | ELFS: Label-Free Coreset Selection with Proxy Training Dynamics はコメントを受け付けていません

Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models

要約 最近のテキスト間拡散モデルは、視覚的な生成タスクの範囲を強化するために効果 … 続きを読む

カテゴリー: cs.AI, cs.CV | Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models はコメントを受け付けていません

X Modality Assisting RGBT Object Tracking

要約 堅牢なマルチモーダル機能表現の開発は、オブジェクト追跡パフォーマンスを強化 … 続きを読む

カテゴリー: cs.CV | X Modality Assisting RGBT Object Tracking はコメントを受け付けていません

Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement

要約 このホワイトペーパーでは、RGB-Dカメラのみを使用してテーブルトップの片 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement はコメントを受け付けていません

MegaLoc: One Retrieval to Place Them All

要約 特定のクエリと同じ場所から画像を取得することは、視覚的な場所認識、ランドマ … 続きを読む

カテゴリー: cs.CV | MegaLoc: One Retrieval to Place Them All はコメントを受け付けていません

Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder

要約 事前に訓練された画像自動エンコーダーは、コンピュータービジョンでますます利 … 続きを読む

カテゴリー: cs.CV | Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder はコメントを受け付けていません