「cs.CV」カテゴリーアーカイブ

Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

投稿日: 2024年12月6日作成者: jarxiv

要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

投稿日: 2024年12月6日作成者: jarxiv

要約 MRI 再構成における最近の進歩は、深層学習ベースのモデルで目覚ましい成功 … 続きを読む →

カテゴリー: cs.CV, cs.LG, physics.med-ph | コメントを受け付けていません

Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise

投稿日: 2024年12月6日作成者: jarxiv

要約最近では、ディープラーニングベースの MRI 再構成モデルが優れたパフ … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph | コメントを受け付けていません

FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning

投稿日: 2024年12月6日作成者: jarxiv

要約 Federated Learning (FL) は、さまざまなクライアント … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | コメントを受け付けていません

Negative Token Merging: Image-based Adversarial Feature Guidance

投稿日: 2024年12月6日作成者: jarxiv

要約否定的なプロンプトを使用したテキストベースの敵対的誘導は、拡散モデルを望ま … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, stat.ML | コメントを受け付けていません

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

投稿日: 2024年12月6日作成者: jarxiv

要約我々は、生成ビジョン基盤モデルである Florence-2 によって生成さ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Grounding Descriptions in Images informs Zero-Shot Visual Recognition

投稿日: 2024年12月6日作成者: jarxiv

要約 CLIP のような視覚言語モデル (VLM) は、オープンな語彙概念に基づ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

投稿日: 2024年12月6日作成者: jarxiv

要約私たちは、言語命令に従って高解像度でフォトリアリスティックな画像を生成でき … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation

投稿日: 2024年12月6日作成者: jarxiv

要約近年、大規模言語モデル (LLM) 内で画像の理解と生成を統合することへの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars

投稿日: 2024年12月6日作成者: jarxiv

要約この論文では、物理的に正確な体と衣服の動きを復元することに特に重点を置き、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise

FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning

Negative Token Merging: Image-based Adversarial Feature Guidance

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Grounding Descriptions in Images informs Zero-Shot Visual Recognition

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation

PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars

最近の投稿

最近のコメント

アーカイブ

カテゴリー