-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Advanced Underwater Image Quality Enhancement via Hybrid Super-Resolution Convolutional Neural Networks and Multi-Scale Retinex-Based Defogging Techniques
要約 この研究レポートでは、光の散乱、吸収、霧のような粒子による水中画像の劣化の … 続きを読む
Dating ancient manuscripts using radiocarbon and AI-based writing style analysis
要約 古代の手書き写本の年代を特定することは、思想の進化を再構築するために不可欠 … 続きを読む
HiCo: Hierarchical Controllable Diffusion Model for Layout-to-image Generation
要約 レイアウトから画像を生成するタスクには、オブジェクトのキャプションとその空 … 続きを読む
カテゴリー: cs.CV
HiCo: Hierarchical Controllable Diffusion Model for Layout-to-image Generation はコメントを受け付けていません
Fast proxy centers for Jeffreys centroids: The Jeffreys-Fisher-Rao and the inductive Gauss-Bregman centers
要約 測定空間上の相互に絶対的に連続する確率分布のセットのジェフリーズ重心とも呼 … 続きを読む
Croc: Pretraining Large Multimodal Models with Cross-Modal Comprehension
要約 大規模言語モデル (LLM) の最近の進歩により、大規模マルチモーダル モ … 続きを読む
カテゴリー: cs.CV
Croc: Pretraining Large Multimodal Models with Cross-Modal Comprehension はコメントを受け付けていません
Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction
要約 アニメーション データは多くの場合、光学式モーション キャプチャ システム … 続きを読む
Zero-shot Action Localization via the Confidence of Large Vision-Language Models
要約 プロスポーツや低侵襲手術などの分野では、トリミングされていないビデオでの正 … 続きを読む
カテゴリー: cs.CV
Zero-shot Action Localization via the Confidence of Large Vision-Language Models はコメントを受け付けていません
2D-3D Deformable Image Registration of Histology Slide and Micro-CT with ML-based Initialization
要約 組織学およびマイクロコンピュータ断層撮影法 ({\mu}CT) の登録にお … 続きを読む
Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition
要約 Visual Speech Recognition (VSR) は、唇の動 … 続きを読む
Impact of imperfect annotations on CNN training and performance for instance segmentation and classification in digital pathology
要約 細胞核などの多数のインスタンスのセグメント化と分類は、正確な診断のためのデ … 続きを読む
カテゴリー: cs.CV
Impact of imperfect annotations on CNN training and performance for instance segmentation and classification in digital pathology はコメントを受け付けていません