cs.CV」カテゴリーアーカイブ

Advancing Generalizable Remote Physiological Measurement through the Integration of Explicit and Implicit Prior Knowledge

要約 遠隔光電脈波(rPPG)は、顔映像から生理信号を取得する有望な技術であり、 … 続きを読む

カテゴリー: cs.CV | Advancing Generalizable Remote Physiological Measurement through the Integration of Explicit and Implicit Prior Knowledge はコメントを受け付けていません

Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration

要約 フォトリアリスティックな画像復元アルゴリズムは、通常、歪み尺度(例えば、P … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration はコメントを受け付けていません

RFL: Simplifying Chemical Structure Recognition with Ring-Free Language

要約 光学的化学構造認識の主な目的は、化学構造画像を対応するマークアップ配列に識 … 続きを読む

カテゴリー: cs.CV | RFL: Simplifying Chemical Structure Recognition with Ring-Free Language はコメントを受け付けていません

A comparison between humans and AI at recognizing objects in unusual poses

要約 ディープラーニングは、いくつかの物体認識ベンチマークにおいて、人間の視覚と … 続きを読む

カテゴリー: cs.CV, cs.LG | A comparison between humans and AI at recognizing objects in unusual poses はコメントを受け付けていません

RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models

要約 リモートセンシングにおける豊富で適切にアノテーションされたマルチモーダルデ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models はコメントを受け付けていません

SEED4D: A Synthetic Ego–Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark

要約 少数ショット補間や外挿設定を含む自心3Dおよび4D再構成のモデルは、監督信 … 続きを読む

カテゴリー: cs.CV | SEED4D: A Synthetic Ego–Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark はコメントを受け付けていません

Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models

要約 LIME (Local Interpretable Model-agnos … 続きを読む

カテゴリー: cs.AI, cs.CV | Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models はコメントを受け付けていません

CityLoc: 6DoF Pose Distributional Localization for Text Descriptions in Large-Scale Scenes with Gaussian Representation

要約 大規模な3Dシーン内のテキスト記述をローカライズすることは、都市内の全ての … 続きを読む

カテゴリー: cs.CV | CityLoc: 6DoF Pose Distributional Localization for Text Descriptions in Large-Scale Scenes with Gaussian Representation はコメントを受け付けていません

DAWN: Domain-Adaptive Weakly Supervised Nuclei Segmentation via Cross-Task Interactions

要約 弱教師付きセグメンテーション手法は、モデル学習時にコストのかかるピクセルレ … 続きを読む

カテゴリー: cs.CV, eess.IV | DAWN: Domain-Adaptive Weakly Supervised Nuclei Segmentation via Cross-Task Interactions はコメントを受け付けていません

Understanding Model Calibration — A gentle introduction and visual exploration of calibration and the expected calibration error (ECE)

要約 モデルが信頼できるとみなされるためには、各決定における信頼度が真の結果を忠 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ME, stat.ML | Understanding Model Calibration — A gentle introduction and visual exploration of calibration and the expected calibration error (ECE) はコメントを受け付けていません