月別アーカイブ: 2025年4月

FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking

要約 大規模な3Dシーンの再構築と新規ビューの合成方法の開発は、主に狭い視野(F … 続きを読む

カテゴリー: cs.CV | FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking はコメントを受け付けていません

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

要約 GPT-4OやLlavaなどの大きなビジョン言語モデル(LVLMS)は、最 … 続きを読む

カテゴリー: cs.AI, cs.CV | AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization はコメントを受け付けていません

Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers

要約 人工ニューラルネットワークの知覚的な侵略性を理解することは、説明可能性を改 … 続きを読む

カテゴリー: cs.CV | Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers はコメントを受け付けていません

Denoising Functional Maps: Diffusion Models for Shape Correspondence

要約 変形可能な形状のペア間の対応を推定することは、困難な問題のままです。 大幅 … 続きを読む

カテゴリー: cs.CV | Denoising Functional Maps: Diffusion Models for Shape Correspondence はコメントを受け付けていません

Target-Aware Video Diffusion Models

要約 ターゲットが認識しているビデオ拡散モデルを提示します。これは、俳優が目的の … 続きを読む

カテゴリー: cs.CV | Target-Aware Video Diffusion Models はコメントを受け付けていません

Bridge the Gap between SNN and ANN for Image Restoration

要約 従来の人工ニューラルネットワーク(ANN)に基づく密な予測のモデルには、特 … 続きを読む

カテゴリー: cs.CV | Bridge the Gap between SNN and ANN for Image Restoration はコメントを受け付けていません

Enhancing Implicit Neural Representations via Symmetric Power Transformation

要約 データ変換の観点から、暗黙の神経表現〜(INR)の能力を高めるために対称電 … 続きを読む

カテゴリー: cs.CV | Enhancing Implicit Neural Representations via Symmetric Power Transformation はコメントを受け付けていません

SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation

要約 近年、拡散モデルの開発により、画像生成タスクとビデオ生成タスクが大幅に進歩 … 続きを読む

カテゴリー: cs.CV | SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation はコメントを受け付けていません

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

要約 このペーパーでは、変圧器GCNデュアルストリームモデルを使用した文脈化され … 続きを読む

カテゴリー: cs.AI, cs.CV | Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation はコメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

要約 うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.AS | Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment はコメントを受け付けていません