月別アーカイブ: 2025年4月

WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model

要約 Video Variation Autoencoder(VAE)はビデオを … 続きを読む

カテゴリー: cs.AI, cs.CV | WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model はコメントを受け付けていません

Open-CD: A Comprehensive Toolbox for Change Detection

要約 Open-CDを提示します。これは、関連するコンポーネントとモジュールと同 … 続きを読む

カテゴリー: cs.CV | Open-CD: A Comprehensive Toolbox for Change Detection はコメントを受け付けていません

Multi-head Ensemble of Smoothed Classifiers for Certified Robustness

要約 ランダム化スムージング(RS)は、認定された堅牢性のための有望な手法であり … 続きを読む

カテゴリー: cs.CV, cs.LG | Multi-head Ensemble of Smoothed Classifiers for Certified Robustness はコメントを受け付けていません

Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions

要約 一般的な環境を積極的に探索しながら、任意のオブジェクトを説明する際のエージ … 続きを読む

カテゴリー: cs.CV, cs.RO | Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions はコメントを受け付けていません

Datasets for Lane Detection in Autonomous Driving: A Comprehensive Review

要約 自動化された運転には正確な車線検出が不可欠であり、さまざまな道路シナリオで … 続きを読む

カテゴリー: cs.CV | Datasets for Lane Detection in Autonomous Driving: A Comprehensive Review はコメントを受け付けていません

Digital Twin Catalog: A Large-Scale Photorealistic 3D Object Digital Twin Dataset

要約 デジタルツインカタログ(DTC)を紹介します。これは、新しい大規模なフォト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Digital Twin Catalog: A Large-Scale Photorealistic 3D Object Digital Twin Dataset はコメントを受け付けていません

Discriminator-Free Direct Preference Optimization for Video Diffusion

要約 直接選好最適化(DPO)は、WIN/LOSITデータペアを通じてモデルを人 … 続きを読む

カテゴリー: cs.CV | Discriminator-Free Direct Preference Optimization for Video Diffusion はコメントを受け付けていません

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

要約 ディープフェイクの顔の急増は、私たちの日常生活に大きな潜在的な悪影響をもた … 続きを読む

カテゴリー: cs.CV | Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection はコメントを受け付けていません

COP-GEN-Beta: Unified Generative Modelling of COPernicus Imagery Thumbnails

要約 リモートセンシングでは、同じシーンをキャプチャするさまざまなセンサーのマル … 続きを読む

カテゴリー: cs.CV, cs.GR | COP-GEN-Beta: Unified Generative Modelling of COPernicus Imagery Thumbnails はコメントを受け付けていません

Proxy-Anchor and EVT-Driven Continual Learning Method for Generalized Category Discovery

要約 継続的な一般化されたカテゴリの発見が、以前に学んだカテゴリの壊滅的な忘却を … 続きを読む

カテゴリー: cs.AI, cs.CV | Proxy-Anchor and EVT-Driven Continual Learning Method for Generalized Category Discovery はコメントを受け付けていません