月別アーカイブ: 2025年2月

PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation

投稿日: 2025年2月20日作成者: jarxiv

要約拡散モデルは、近年大きな進歩を遂げています。ただし、不均衡なデータセット … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

MagicGeo: Training-Free Text-Guided Geometric Diagram Generation

投稿日: 2025年2月20日作成者: jarxiv

要約幾何学的図は、数学的および科学的概念を伝える上で重要ですが、従来の図の生成 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

投稿日: 2025年2月20日作成者: jarxiv

要約 MRI再構築における最近の進歩は、深い学習ベースのモデルを通じて顕著な成功 … 続きを読む →

カテゴリー: cs.CV, cs.LG, physics.med-ph | コメントを受け付けていません

MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection

投稿日: 2025年2月20日作成者: jarxiv

要約ビデオカモフラージュオブジェクト検出（VCOD）は、ビデオのバックグラウン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

投稿日: 2025年2月20日作成者: jarxiv

要約感情を理解することは、人間のコミュニケーションの基本的な側面です。オーデ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS, F.2.2 | コメントを受け付けていません

MEX: Memory-efficient Approach to Referring Multi-Object Tracking

投稿日: 2025年2月20日作成者: jarxiv

要約参照マルチオブジェクト追跡（RMOT）は、コンピュータービジョンと自然言語 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Multi-view Video-Pose Pretraining for Operating Room Surgical Activity Recognition

投稿日: 2025年2月20日作成者: jarxiv

要約複雑な手術室での外科的処置のワークフローを理解するには、臨床医とその環境間 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MetaSSC: Enhancing 3D Semantic Scene Completion for Autonomous Driving through Meta-Learning and Long-sequence Modeling

投稿日: 2025年2月20日作成者: jarxiv

要約セマンティックシーンの完了（SSC）は、自律運転システムで包括的な認識を達 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

投稿日: 2025年2月20日作成者: jarxiv

要約拡散トランスは、テキスト間合成に広く採用されています。これらのモデルを数 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants

投稿日: 2025年2月20日作成者: jarxiv

要約なじみのない環境をナビゲートすることは、家庭用ロボットに大きな課題をもたら … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

月別アーカイブ: 2025年2月

PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation

MagicGeo: Training-Free Text-Guided Geometric Diagram Generation

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

MEX: Memory-efficient Approach to Referring Multi-Object Tracking

Multi-view Video-Pose Pretraining for Operating Room Surgical Activity Recognition

MetaSSC: Enhancing 3D Semantic Scene Completion for Autonomous Driving through Meta-Learning and Long-sequence Modeling

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants

最近の投稿

最近のコメント

アーカイブ

カテゴリー