月別アーカイブ: 2024年3月

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

投稿日: 2024年3月5日作成者: jarxiv

要約意味理解は、高密度同時定位マッピング（SLAM）において重要な役割を果たす … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with Target Scattering Feature Parameters

投稿日: 2024年3月5日作成者: jarxiv

要約ディープニューラルネットワークベースの合成開口レーダー（SAR）ターゲット … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CLIP-AD: A Language-Guided Staged Dual-Path Model for Zero-shot Anomaly Detection

投稿日: 2024年3月5日作成者: jarxiv

要約本論文では、テストオブジェクトの参照画像なしでADを実行する、ゼロショット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion

投稿日: 2024年3月5日作成者: jarxiv

要約近年、テキストから画像への生成モデルの開発が大きく進展している。しかし、こ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neural Implicit Morphing of Face Images

投稿日: 2024年3月5日作成者: jarxiv

要約顔のモーフィングは、コンピュータグラフィックスにおける問題であり、多くの芸 … 続きを読む →

カテゴリー: cs.CV, cs.LG, I.4.10 | コメントを受け付けていません

Boosting Box-supervised Instance Segmentation with Pseudo Depth

投稿日: 2024年3月5日作成者: jarxiv

要約箱庭監視の下での弱監視インスタンス分割（WSIS）の領域は、近年目覚ましい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

投稿日: 2024年3月5日作成者: jarxiv

要約本論文では、与えられたジェネレータの潜在コードを生成するシンプルな顔交換フ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment

投稿日: 2024年3月5日作成者: jarxiv

要約数多くの研究が完了しているにもかかわらず、任意の音声に対応する高度に同期し … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

DiffSal: Joint Audio and Video Learning for Diffusion Saliency Prediction

投稿日: 2024年3月5日作成者: jarxiv

要約オーディオビジュアルの顕著性予測は、多様なモダリティの補完からサポートを得 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Decompose-and-Compose: A Compositional Approach to Mitigating Spurious Correlation

投稿日: 2024年3月5日作成者: jarxiv

要約標準的な経験的リスク最小化（ERM）学習は、分布内データに対する画像分類に … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年3月

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with Target Scattering Feature Parameters

CLIP-AD: A Language-Guided Staged Dual-Path Model for Zero-shot Anomaly Detection

TCIG: Two-Stage Controlled Image Generation with Quality Enhancement through Diffusion

Neural Implicit Morphing of Face Images

Boosting Box-supervised Instance Segmentation with Pseudo Depth

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment

DiffSal: Joint Audio and Video Learning for Diffusion Saliency Prediction

Decompose-and-Compose: A Compositional Approach to Mitigating Spurious Correlation

最近の投稿

最近のコメント

アーカイブ

カテゴリー