「cs.CV」カテゴリーアーカイブ

Machine Learning Modeling for Multi-order Human Visual Motion Processing

投稿日: 2025年1月23日作成者: jarxiv

要約私たちの研究は、人間と同じように視覚的な動きを認識することを学習するマシン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

投稿日: 2025年1月23日作成者: jarxiv

要約高解像度のテクスチャ付き 3D アセットを生成するための高度な大規模 3D … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks

投稿日: 2025年1月23日作成者: jarxiv

要約単眼深度推定 (MDE) は、コンピュータービジョンにおける困難なタスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FDG-Diff: Frequency-Domain-Guided Diffusion Framework for Compressed Hazy Image Restoration

投稿日: 2025年1月23日作成者: jarxiv

要約この研究では、ヘイズの劣化と JPEG 圧縮の間の相互作用によって複雑な結 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

AMM-Diff: Adaptive Multi-Modality Diffusion Network for Missing Modality Imputation

投稿日: 2025年1月23日作成者: jarxiv

要約臨床現場では、多くの場合、複雑な取得プロトコル、厳格なプライバシー規制、ま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GAMED-Snake: Gradient-aware Adaptive Momentum Evolution Deep Snake Model for Multi-organ Segmentation

投稿日: 2025年1月23日作成者: jarxiv

要約多臓器セグメンテーションは、複雑な解剖学的背景、曖昧な境界、多様な形態のた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

OmniCount: Multi-label Object Counting with Semantic-Geometric Priors

投稿日: 2025年1月23日作成者: jarxiv

要約オブジェクトのカウントは、シーンの構成を理解する上で極めて重要です。以前 … 続きを読む →

カテゴリー: cs.CV, eess.IV, eess.SP | コメントを受け付けていません

CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation

投稿日: 2025年1月23日作成者: jarxiv

要約工業用コンクリート表面の亀裂のセグメンテーションは、通常、亀裂が細長く複雑 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training

投稿日: 2025年1月23日作成者: jarxiv

要約自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning

投稿日: 2025年1月23日作成者: jarxiv

要約手書き文書認識 (HDR) は最近大幅に進歩しましたが、複雑な背景、多様な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Machine Learning Modeling for Multi-order Human Visual Motion Processing

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks

FDG-Diff: Frequency-Domain-Guided Diffusion Framework for Compressed Hazy Image Restoration

AMM-Diff: Adaptive Multi-Modality Diffusion Network for Missing Modality Imputation

GAMED-Snake: Gradient-aware Adaptive Momentum Evolution Deep Snake Model for Multi-organ Segmentation

OmniCount: Multi-label Object Counting with Semantic-Geometric Priors

CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation

Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training

DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー