cs.CV」カテゴリーアーカイブ

Machine Learning Modeling for Multi-order Human Visual Motion Processing

要約 私たちの研究は、人間と同じように視覚的な動きを認識することを学習するマシン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Machine Learning Modeling for Multi-order Human Visual Motion Processing はコメントを受け付けていません

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

要約 高解像度のテクスチャ付き 3D アセットを生成するための高度な大規模 3D … 続きを読む

カテゴリー: cs.CV | Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation はコメントを受け付けていません

Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks

要約 単眼深度推定 (MDE) は、コンピューター ビジョンにおける困難なタスク … 続きを読む

カテゴリー: cs.CV | Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks はコメントを受け付けていません

FDG-Diff: Frequency-Domain-Guided Diffusion Framework for Compressed Hazy Image Restoration

要約 この研究では、ヘイズの劣化と JPEG 圧縮の間の相互作用によって複雑な結 … 続きを読む

カテゴリー: cs.CV, eess.IV | FDG-Diff: Frequency-Domain-Guided Diffusion Framework for Compressed Hazy Image Restoration はコメントを受け付けていません

AMM-Diff: Adaptive Multi-Modality Diffusion Network for Missing Modality Imputation

要約 臨床現場では、多くの場合、複雑な取得プロトコル、厳格なプライバシー規制、ま … 続きを読む

カテゴリー: cs.CV | AMM-Diff: Adaptive Multi-Modality Diffusion Network for Missing Modality Imputation はコメントを受け付けていません

GAMED-Snake: Gradient-aware Adaptive Momentum Evolution Deep Snake Model for Multi-organ Segmentation

要約 多臓器セグメンテーションは、複雑な解剖学的背景、曖昧な境界、多様な形態のた … 続きを読む

カテゴリー: cs.AI, cs.CV | GAMED-Snake: Gradient-aware Adaptive Momentum Evolution Deep Snake Model for Multi-organ Segmentation はコメントを受け付けていません

OmniCount: Multi-label Object Counting with Semantic-Geometric Priors

要約 オブジェクトのカウントは、シーンの構成を理解する上で極めて重要です。 以前 … 続きを読む

カテゴリー: cs.CV, eess.IV, eess.SP | OmniCount: Multi-label Object Counting with Semantic-Geometric Priors はコメントを受け付けていません

CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation

要約 工業用コンクリート表面の亀裂のセグメンテーションは、通常、亀裂が細長く複雑 … 続きを読む

カテゴリー: cs.CV | CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation はコメントを受け付けていません

Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training

要約 自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training はコメントを受け付けていません

DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning

要約 手書き文書認識 (HDR) は最近大幅に進歩しましたが、複雑な背景、多様な … 続きを読む

カテゴリー: cs.CV | DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning はコメントを受け付けていません