-
最近の投稿
- MikuDance: Animating Character Art with Mixed Motion Dynamics
- Towards Objective and Unbiased Decision Assessments with LLM-Enhanced Hierarchical Attention Networks
- Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation
- Dynamic Rewarding with Prompt Optimization Enables Tuning-free Self-Alignment of Language Models
- CoBL-Diffusion: Diffusion-Based Conditional Robot Planning in Dynamic Environments Using Control Barrier and Lyapunov Functions
-
最近のコメント
表示できるコメントはありません。 cs.AI (29591) cs.CL (22345) cs.CR (2300) cs.CV (36015) cs.LG (34416) cs.RO (17154) cs.SY (2637) eess.IV (4375) eess.SY (2631) stat.ML (4603)
月別アーカイブ: 2024年9月
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design
要約 私たちは、エンジニアリング設計でディープジェネレーティブモデル (DGM) … 続きを読む
ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis
要約 ボランティア地理情報 (VGI) は、その種類が豊富で、大容量で、迅速な更 … 続きを読む
Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors
要約 拡散ベースの画像超解像度 (SR) 手法は、事前にトレーニングされた大規模 … 続きを読む
カテゴリー: cs.CV
Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors はコメントを受け付けていません
Benchmarking Domain Generalization Algorithms in Computational Pathology
要約 深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であ … 続きを読む
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification
要約 自然信号の主観的な品質は、客観的な知覚指標で近似できます。 人間の観察者の … 続きを読む
Can Vision Language Models Learn from Visual Demonstrations of Ambiguous Spatial Reasoning?
要約 大規模ビジョン言語モデル (VLM) は、多くのコンピューター ビジョン … 続きを読む
Parameter-efficient Bayesian Neural Networks for Uncertainty-aware Depth Estimation
要約 単眼深度推定 (MDE) などの最先端のコンピューター ビジョン タスクは … 続きを読む
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification
要約 医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む
BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices
要約 ディープ ニューラル ネットワーク (DNN) は、画像分類、オブジェクト … 続きを読む
カテゴリー: cs.CV
BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices はコメントを受け付けていません
General Detection-based Text Line Recognition
要約 ラテン文字、中国語文字、または暗号化文字を使用した印刷 (OCR) または … 続きを読む
カテゴリー: cs.CV
General Detection-based Text Line Recognition はコメントを受け付けていません