cs.CV」カテゴリーアーカイブ

The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification

要約 自然信号の主観的な品質は、客観的な知覚指標で近似できます。 人間の観察者の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | コメントする

Can Vision Language Models Learn from Visual Demonstrations of Ambiguous Spatial Reasoning?

要約 大規模ビジョン言語モデル (VLM) は、多くのコンピューター ビジョン … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Parameter-efficient Bayesian Neural Networks for Uncertainty-aware Depth Estimation

要約 単眼深度推定 (MDE) などの最先端のコンピューター ビジョン タスクは … 続きを読む

カテゴリー: cs.CV, stat.ML | コメントする

Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification

要約 医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices

要約 ディープ ニューラル ネットワーク (DNN) は、画像分類、オブジェクト … 続きを読む

カテゴリー: cs.CV | コメントする

General Detection-based Text Line Recognition

要約 ラテン文字、中国語文字、または暗号化文字を使用した印刷 (OCR) または … 続きを読む

カテゴリー: cs.CV | コメントする

LingoQA: Video Question Answering for Autonomous Driving

要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts

要約 最新のソフトウェアで複雑なコンピューター支援設計 (CAD) モデルのプロ … 続きを読む

カテゴリー: cs.CV, cs.GR | コメントする

Unveiling Ontological Commitment in Multi-Modal Foundation Models

要約 存在論的コミットメント、つまり使用される概念、関係、仮定は、定性的推論 ( … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

MorphoSeg: An Uncertainty-Aware Deep Learning Method for Biomedical Segmentation of Complex Cellular Morphologies

要約 ディープラーニングは、特にセグメンテーションタスクにおいて、医療および生物 … 続きを読む

カテゴリー: cs.CV | コメントする