-
最近の投稿
- Global-Local Interface with Selective Direct and Singularity-Avoiding Motion Mapping for Intuitive Teleoperation
- Data-Dependent Hidden Markov Model with Off-Road State Determination and Real-Time Viterbi Algorithm for Lane Determination in Autonomous Vehicles
- Prismatic-Bending Transformable (PBT) Joint for a Modular, Foldable Manipulator with Enhanced Reachability and Dexterity
- Simplification of Robotic System Model Analysis by Petri Net Meta-Model Property Transfer
- Steerable Scene Generation with Post Training and Inference-Time Search
-
最近のコメント
表示できるコメントはありません。 cs.AI (37825) cs.CL (28592) cs.CV (43449) cs.HC (2892) cs.LG (42754) cs.RO (22471) cs.SY (3449) eess.IV (5040) eess.SY (3441) stat.ML (5580)
投稿者「jarxiv」のアーカイブ
Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection
要約 3Dマスクのプレゼンテーション攻撃の検出は、3Dマスク攻撃の上昇する脅威か … 続きを読む
Learning Unknown Spoof Prompts for Generalized Face Anti-Spoofing Using Only Real Face Images
要約 フェイスアンチスプーフィングは、顔認識システムのセキュリティを確保するため … 続きを読む
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing
要約 リモートフォトプレチスモグラフィ(RPPG)は、非接触生理的測定を可能にし … 続きを読む
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map
要約 コンピュータービジョン、特に産業用途向けの合成データセット生成は、依然とし … 続きを読む
Cobra: Efficient Line Art COlorization with BRoAder References
要約 コミック生産業界では、高精度、効率、コンテキストの一貫性、柔軟な制御を備え … 続きを読む
Rethinking Meta-Learning from a Learning Lens
要約 メタラーニングは、目に見えないタスクを解決するために、トレーニングタスクか … 続きを読む
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision
要約 ビデオ品質評価(VQA)は、カメラキャプチャシステムからオーバーザトップス … 続きを読む
FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback
要約 大規模なビジョン言語モデル(LVLMS)は、さまざまな視覚言語タスクへの取 … 続きを読む
Towards Smart Point-and-Shoot Photography
要約 数億人がスマートフォンをPoint and Shoot(PAS)カメラとし … 続きを読む