cs.AI」カテゴリーアーカイブ

Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning

要約 幼児は、言語入力の獲得に先立って、複雑な視覚的理解を急速に発達させます。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning はコメントを受け付けていません

Towards Balanced Continual Multi-Modal Learning in Human Pose Estimation

要約 3D 人間姿勢推定 (3D HPE) は、特に RGB ベースの手法の分野 … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Balanced Continual Multi-Modal Learning in Human Pose Estimation はコメントを受け付けていません

Geometry Restoration and Dewarping of Camera-Captured Document Images

要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Geometry Restoration and Dewarping of Camera-Captured Document Images はコメントを受け付けていません

Less is More: The Influence of Pruning on the Explainability of CNNs

要約 コンピューター ビジョンにおける最新の畳み込みニューラル ネットワーク ( … 続きを読む

カテゴリー: cs.AI, cs.CV | Less is More: The Influence of Pruning on the Explainability of CNNs はコメントを受け付けていません

A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics はコメントを受け付けていません

AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

要約 オンラインで入手可能な画像テキスト データの膨大なリポジトリを活用して、大 … 続きを読む

カテゴリー: cs.AI, cs.CV | AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning はコメントを受け付けていません

Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces

要約 ビデオ トークナイザーは潜在ビデオ拡散モデルに不可欠であり、生のビデオ デ … 続きを読む

カテゴリー: cs.AI, cs.CV | Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces はコメントを受け付けていません

Consistent Flow Distillation for Text-to-3D Generation

要約 スコア蒸留サンプリング (SDS) は、3D 生成用の画像生成モデルの蒸留 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Consistent Flow Distillation for Text-to-3D Generation はコメントを受け付けていません

An Empirical Study of Autoregressive Pre-training from Videos

要約 私たちはビデオからの自己回帰事前トレーニングを実証的に研究しています。 研 … 続きを読む

カテゴリー: cs.AI, cs.CV | An Empirical Study of Autoregressive Pre-training from Videos はコメントを受け付けていません

MedCoDi-M: A Multi-Prompt Foundation Model for Multimodal Medical Data Generation

要約 人工知能は医療現場に革命をもたらし、診断の精度と医療提供を強化しています。 … 続きを読む

カテゴリー: cs.AI, cs.LG | MedCoDi-M: A Multi-Prompt Foundation Model for Multimodal Medical Data Generation はコメントを受け付けていません