月別アーカイブ: 2025年2月

A Survey on Image Quality Assessment: Insights, Analysis, and Future Outlook

要約 画質評価(IQA)は、画像中心のテクノロジーにおける極めて重要な課題を表し … 続きを読む

カテゴリー: cs.CV | A Survey on Image Quality Assessment: Insights, Analysis, and Future Outlook はコメントを受け付けていません

Moment of Untruth: Dealing with Negative Queries in Video Moment Retrieval

要約 ビデオモーメント検索は、視覚言語モデルのパフォーマンスを評価するための一般 … 続きを読む

カテゴリー: cs.CV | Moment of Untruth: Dealing with Negative Queries in Video Moment Retrieval はコメントを受け付けていません

Copula-based mixture model identification for subgroup clustering with imaging applications

要約 モデルベースのクラスタリング技術はさまざまなアプリケーション領域に広く適用 … 続きを読む

カテゴリー: cs.CV, cs.LG | Copula-based mixture model identification for subgroup clustering with imaging applications はコメントを受け付けていません

Human-Centric Foundation Models: Perception, Generation and Agentic Modeling

要約 人間の理解と生成は、デジタル人間とヒューマノイドの実施形態をモデル化するた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Human-Centric Foundation Models: Perception, Generation and Agentic Modeling はコメントを受け付けていません

TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning

要約 マルチモーダル大手言語モデル(MLLMS)は、短いビデオ理解で印象的なパフ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning はコメントを受け付けていません

Brain Latent Progression: Individual-based Spatiotemporal Disease Progression on 3D Brain MRIs via Latent Diffusion

要約 縦方向の磁気共鳴イメージング(MRI)データセットの利用可能性の増加により … 続きを読む

カテゴリー: cs.AI, cs.CV | Brain Latent Progression: Individual-based Spatiotemporal Disease Progression on 3D Brain MRIs via Latent Diffusion はコメントを受け付けていません

AR Glulam: Accurate Augmented Reality Using Multiple Fiducial Markers for Glulam Fabrication

要約 拡張現実(AR)における最近の進歩は、建築、設計、および製造におけるアプリ … 続きを読む

カテゴリー: cs.CV, cs.ET, cs.HC | AR Glulam: Accurate Augmented Reality Using Multiple Fiducial Markers for Glulam Fabrication はコメントを受け付けていません

A Novel Approach to for Multimodal Emotion Recognition : Multimodal semantic information fusion

要約 人工知能とコンピュータービジョンテクノロジーの進歩により、マルチモーダル感 … 続きを読む

カテゴリー: cs.AI, cs.CV | A Novel Approach to for Multimodal Emotion Recognition : Multimodal semantic information fusion はコメントを受け付けていません

Ultrasound Image Generation using Latent Diffusion Models

要約 画像生成の拡散モデルは、多様で高品質の画像を生成する能力により、関心が高ま … 続きを読む

カテゴリー: 68-06, cs.CV | Ultrasound Image Generation using Latent Diffusion Models はコメントを受け付けていません

Light-A-Video: Training-free Video Relighting via Progressive Light Fusion

要約 大規模なデータセットと事前に訓練された拡散モデルによって駆動される画像の学 … 続きを読む

カテゴリー: cs.CV | Light-A-Video: Training-free Video Relighting via Progressive Light Fusion はコメントを受け付けていません