月別アーカイブ: 2024年3月

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

要約 意味理解は、高密度同時定位マッピング(SLAM)において重要な役割を果たす … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM はコメントを受け付けていません

SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with Target Scattering Feature Parameters

要約 ディープニューラルネットワークベースの合成開口レーダー(SAR)ターゲット … 続きを読む

カテゴリー: cs.AI, cs.CV | SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with Target Scattering Feature Parameters はコメントを受け付けていません

CLIP-AD: A Language-Guided Staged Dual-Path Model for Zero-shot Anomaly Detection

要約 本論文では、テストオブジェクトの参照画像なしでADを実行する、ゼロショット … 続きを読む

カテゴリー: cs.CV | CLIP-AD: A Language-Guided Staged Dual-Path Model for Zero-shot Anomaly Detection はコメントを受け付けていません

TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion

要約 近年、テキストから画像への生成モデルの開発が大きく進展している。しかし、こ … 続きを読む

カテゴリー: cs.CV | TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion はコメントを受け付けていません

Neural Implicit Morphing of Face Images

要約 顔のモーフィングは、コンピュータグラフィックスにおける問題であり、多くの芸 … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4.10 | Neural Implicit Morphing of Face Images はコメントを受け付けていません

Boosting Box-supervised Instance Segmentation with Pseudo Depth

要約 箱庭監視の下での弱監視インスタンス分割(WSIS)の領域は、近年目覚ましい … 続きを読む

カテゴリー: cs.CV | Boosting Box-supervised Instance Segmentation with Pseudo Depth はコメントを受け付けていません

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

要約 本論文では、与えられたジェネレータの潜在コードを生成するシンプルな顔交換フ … 続きを読む

カテゴリー: cs.CV | LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping はコメントを受け付けていません

G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment

要約 数多くの研究が完了しているにもかかわらず、任意の音声に対応する高度に同期し … 続きを読む

カテゴリー: cs.CV, cs.MM | G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment はコメントを受け付けていません

DiffSal: Joint Audio and Video Learning for Diffusion Saliency Prediction

要約 オーディオビジュアルの顕著性予測は、多様なモダリティの補完からサポートを得 … 続きを読む

カテゴリー: cs.CV | DiffSal: Joint Audio and Video Learning for Diffusion Saliency Prediction はコメントを受け付けていません

Decompose-and-Compose: A Compositional Approach to Mitigating Spurious Correlation

要約 標準的な経験的リスク最小化(ERM)学習は、分布内データに対する画像分類に … 続きを読む

カテゴリー: cs.CV, cs.LG | Decompose-and-Compose: A Compositional Approach to Mitigating Spurious Correlation はコメントを受け付けていません