「cs.CV」カテゴリーアーカイブ

From Pixels to Polygons: A Survey of Deep Learning Approaches for Medical Image-to-Mesh Reconstruction

投稿日: 2025年5月7日作成者: jarxiv

要約ディープラーニングに基づいた医療画像からメッシュへの再構成が急速に進化し、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model

投稿日: 2025年5月7日作成者: jarxiv

要約オーディオ駆動型のヒューマンアニメーションテクノロジーは、ヒューマンコンピ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection

投稿日: 2025年5月7日作成者: jarxiv

要約 3Dマスクのプレゼンテーション攻撃の検出は、3Dマスク攻撃の上昇する脅威か … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Learning Unknown Spoof Prompts for Generalized Face Anti-Spoofing Using Only Real Face Images

投稿日: 2025年5月7日作成者: jarxiv

要約フェイスアンチスプーフィングは、顔認識システムのセキュリティを確保するため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing

投稿日: 2025年5月7日作成者: jarxiv

要約リモートフォトプレチスモグラフィ（RPPG）は、非接触生理的測定を可能にし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map

投稿日: 2025年5月7日作成者: jarxiv

要約コンピュータービジョン、特に産業用途向けの合成データセット生成は、依然とし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cobra: Efficient Line Art COlorization with BRoAder References

投稿日: 2025年5月7日作成者: jarxiv

要約コミック生産業界では、高精度、効率、コンテキストの一貫性、柔軟な制御を備え … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rethinking Meta-Learning from a Learning Lens

投稿日: 2025年5月7日作成者: jarxiv

要約メタラーニングは、目に見えないタスクを解決するために、トレーニングタスクか … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision

投稿日: 2025年5月7日作成者: jarxiv

要約ビデオ品質評価（VQA）は、カメラキャプチャシステムからオーバーザトップス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback

投稿日: 2025年5月7日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）は、さまざまな視覚言語タスクへの取 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

From Pixels to Polygons: A Survey of Deep Learning Approaches for Medical Image-to-Mesh Reconstruction

PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model

Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection

Learning Unknown Spoof Prompts for Generalized Face Anti-Spoofing Using Only Real Face Images

PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing

Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map

Cobra: Efficient Line Art COlorization with BRoAder References

Rethinking Meta-Learning from a Learning Lens

Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision

FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback

最近の投稿

最近のコメント

アーカイブ

カテゴリー