cs.CV」カテゴリーアーカイブ

Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction はコメントを受け付けていません

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

要約 MRI 再構成における最近の進歩は、深層学習ベースのモデルで目覚ましい成功 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.med-ph | Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data はコメントを受け付けていません

Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise

要約 最近では、ディープラーニングベースの MRI 再構成モデ​​ルが優れたパフ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph | Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise はコメントを受け付けていません

FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning

要約 Federated Learning (FL) は、さまざまなクライアント … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning はコメントを受け付けていません

Negative Token Merging: Image-based Adversarial Feature Guidance

要約 否定的なプロンプトを使用したテキストベースの敵対的誘導は、拡散モデルを望ま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, stat.ML | Negative Token Merging: Image-based Adversarial Feature Guidance はコメントを受け付けていません

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

要約 我々は、生成ビジョン基盤モデルである Florence-2 によって生成さ … 続きを読む

カテゴリー: cs.AI, cs.CV | Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion はコメントを受け付けていません

Grounding Descriptions in Images informs Zero-Shot Visual Recognition

要約 CLIP のような視覚言語モデル (VLM) は、オープンな語彙概念に基づ … 続きを読む

カテゴリー: cs.CV, cs.LG | Grounding Descriptions in Images informs Zero-Shot Visual Recognition はコメントを受け付けていません

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

要約 私たちは、言語命令に従って高解像度でフォトリアリスティックな画像を生成でき … 続きを読む

カテゴリー: cs.CV | Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis はコメントを受け付けていません

Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation

要約 近年、大規模言語モデル (LLM) 内で画像の理解と生成を統合することへの … 続きを読む

カテゴリー: cs.CV | Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation はコメントを受け付けていません

PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars

要約 この論文では、物理的に正確な体と衣服の動きを復元することに特に重点を置き、 … 続きを読む

カテゴリー: cs.CV | PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars はコメントを受け付けていません