投稿者「jarxiv」のアーカイブ

Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection

要約 3Dマスクのプレゼンテーション攻撃の検出は、3Dマスク攻撃の上昇する脅威か … 続きを読む

カテゴリー: cs.CV | コメントする

Learning Unknown Spoof Prompts for Generalized Face Anti-Spoofing Using Only Real Face Images

要約 フェイスアンチスプーフィングは、顔認識システムのセキュリティを確保するため … 続きを読む

カテゴリー: cs.CV | コメントする

PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing

要約 リモートフォトプレチスモグラフィ(RPPG)は、非接触生理的測定を可能にし … 続きを読む

カテゴリー: cs.CV | コメントする

Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map

要約 コンピュータービジョン、特に産業用途向けの合成データセット生成は、依然とし … 続きを読む

カテゴリー: cs.CV | コメントする

Cobra: Efficient Line Art COlorization with BRoAder References

要約 コミック生産業界では、高精度、効率、コンテキストの一貫性、柔軟な制御を備え … 続きを読む

カテゴリー: cs.CV | コメントする

Rethinking Meta-Learning from a Learning Lens

要約 メタラーニングは、目に見えないタスクを解決するために、トレーニングタスクか … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision

要約 ビデオ品質評価(VQA)は、カメラキャプチャシステムからオーバーザトップス … 続きを読む

カテゴリー: cs.CV | コメントする

FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback

要約 大規模なビジョン言語モデル(LVLMS)は、さまざまな視覚言語タスクへの取 … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Towards Smart Point-and-Shoot Photography

要約 数億人がスマートフォンをPoint and Shoot(PAS)カメラとし … 続きを読む

カテゴリー: cs.CV | コメントする

ALMA: Aggregated Lipschitz Maximization Attack on Auto-encoders

要約 重要なアプリケーションでのディープオートエンコーダー(AE)の広範な使用に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする