「cs.CV」カテゴリーアーカイブ

Thinking with Generated Images

投稿日: 2025年5月29日作成者: jarxiv

要約生成された画像で思考を提示します。これは、中間視覚的思考ステップの自発的な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

投稿日: 2025年5月29日作成者: jarxiv

要約河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Scaling-up Perceptual Video Quality Assessment

投稿日: 2025年5月29日作成者: jarxiv

要約データスケーリング法は、さまざまな下流タスクにわたる大規模なマルチモーダル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification

投稿日: 2025年5月29日作成者: jarxiv

要約限られたDXAアクセスは、骨粗鬆症のスクリーニングを妨げます。この概念実 … 続きを読む →

カテゴリー: cs.CV, stat.AP | コメントを受け付けていません

Preference Adaptive and Sequential Text-to-Image Generation

投稿日: 2025年5月29日作成者: jarxiv

要約インタラクティブなテキストからイメージ（T2I）生成の問題に対処し、一連の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SY, eess.SY | コメントを受け付けていません

MultiFormer: A Multi-Person Pose Estimation System Based on CSI and Attention Mechanism

投稿日: 2025年5月29日作成者: jarxiv

要約チャネル状態情報（CSI）に基づく人間のポーズ推定は、非侵入的で正確な人間 … 続きを読む →

カテゴリー: cs.CV, eess.SP | コメントを受け付けていません

PRISM: Video Dataset Condensation with Progressive Refinement and Insertion for Sparse Motion

投稿日: 2025年5月29日作成者: jarxiv

要約ビデオデータセットの凝縮は、ディープ学習アプリケーションでの大規模なビデオ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Universal Visuo-Tactile Video Understanding for Embodied Interaction

投稿日: 2025年5月29日作成者: jarxiv

要約具体的な知覚は、具体化されたエージェントが目視検査だけでは決定できないオブ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Multipath cycleGAN for harmonization of paired and unpaired low-dose lung computed tomography reconstruction kernels

投稿日: 2025年5月29日作成者: jarxiv

要約コンピューター断層撮影（CT）の再構築カーネルは、空間分解能とノイズ特性に … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

ImageReFL: Balancing Quality and Diversity in Human-Aligned Diffusion Models

投稿日: 2025年5月29日作成者: jarxiv

要約拡散モデルの最近の進歩は、印象的な画像生成機能につながりましたが、これらの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Thinking with Generated Images

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

Scaling-up Perceptual Video Quality Assessment

Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification

Preference Adaptive and Sequential Text-to-Image Generation

MultiFormer: A Multi-Person Pose Estimation System Based on CSI and Attention Mechanism

PRISM: Video Dataset Condensation with Progressive Refinement and Insertion for Sparse Motion

Universal Visuo-Tactile Video Understanding for Embodied Interaction

Multipath cycleGAN for harmonization of paired and unpaired low-dose lung computed tomography reconstruction kernels

ImageReFL: Balancing Quality and Diversity in Human-Aligned Diffusion Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー