月別アーカイブ: 2025年4月

FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な3Dシーンの再構築と新規ビューの合成方法の開発は、主に狭い視野（F … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

投稿日: 2025年4月3日作成者: jarxiv

要約 GPT-4OやLlavaなどの大きなビジョン言語モデル（LVLMS）は、最 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers

投稿日: 2025年4月3日作成者: jarxiv

要約人工ニューラルネットワークの知覚的な侵略性を理解することは、説明可能性を改 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Denoising Functional Maps: Diffusion Models for Shape Correspondence

投稿日: 2025年4月3日作成者: jarxiv

要約変形可能な形状のペア間の対応を推定することは、困難な問題のままです。大幅 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Target-Aware Video Diffusion Models

投稿日: 2025年4月3日作成者: jarxiv

要約ターゲットが認識しているビデオ拡散モデルを提示します。これは、俳優が目的の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Bridge the Gap between SNN and ANN for Image Restoration

投稿日: 2025年4月3日作成者: jarxiv

要約従来の人工ニューラルネットワーク（ANN）に基づく密な予測のモデルには、特 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Enhancing Implicit Neural Representations via Symmetric Power Transformation

投稿日: 2025年4月3日作成者: jarxiv

要約データ変換の観点から、暗黙の神経表現〜（INR）の能力を高めるために対称電 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation

投稿日: 2025年4月3日作成者: jarxiv

要約近年、拡散モデルの開発により、画像生成タスクとビデオ生成タスクが大幅に進歩 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

投稿日: 2025年4月3日作成者: jarxiv

要約このペーパーでは、変圧器GCNデュアルストリームモデルを使用した文脈化され … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

投稿日: 2025年4月3日作成者: jarxiv

要約うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.AS | コメントを受け付けていません

月別アーカイブ: 2025年4月

FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers

Denoising Functional Maps: Diffusion Models for Shape Correspondence

Target-Aware Video Diffusion Models

Bridge the Gap between SNN and ANN for Image Restoration

Enhancing Implicit Neural Representations via Symmetric Power Transformation

SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

最近の投稿

最近のコメント

アーカイブ

カテゴリー