-
最近の投稿
- Design, Integration, and Evaluation of a Dual-Arm Robotic System for High Throughput Tissue Sampling from Potato Tubers
- Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures
- Reconfigurable legged metamachines that run on autonomous modular legs
- Improved Approximation of Sensor Network Performance for Seabed Acoustic Sensors
- HMCF: A Human-in-the-loop Multi-Robot Collaboration Framework Based on Large Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (37540) cs.CL (28390) cs.CV (43189) cs.HC (2869) cs.LG (42477) cs.RO (22278) cs.SY (3418) eess.IV (5019) eess.SY (3410) stat.ML (5541)
投稿者「jarxiv」のアーカイブ
Cascade Detector Analysis and Application to Biomedical Microscopy
要約 コンピュータービジョンモデルと生物医学データセットの両方がサイズが増加する … 続きを読む
Mcity Data Engine: Iterative Model Improvement Through Open-Vocabulary Data Selection
要約 データが増え続ける可能性があるため、機械学習モデルのトレーニングに適したサ … 続きを読む
HOT3D: Hand and Object Tracking in 3D from Egocentric Multi-View Videos
要約 3Dでエゴセントリックハンドとオブジェクト追跡のために公開されているデータ … 続きを読む
VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions
要約 フォント設計は、デジタルコンテンツデザインと最新の印刷業界で非常に重要です … 続きを読む
BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents
要約 世界モデルは、潜在的な将来のシナリオを予測する能力のために、自律運転に注目 … 続きを読む
Diffusion-based Adversarial Identity Manipulation for Facial Privacy Protection
要約 フェイス認識(FR)システムの成功により、潜在的な不正な監視とソーシャルネ … 続きを読む
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation
要約 拡散モデルの急速な進歩は、通常、ユーザーエクスペリエンスにシーンレベルの4 … 続きを読む
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies
要約 近年、視覚変圧器(VITS)は、画像分類、オブジェクト検出、セグメンテーシ … 続きを読む
Visual Text Processing: A Comprehensive Review and Unified Evaluation
要約 視覚テキストは、ドキュメント画像とシーン画像の両方で重要なコンポーネントで … 続きを読む