cs.CV」カテゴリーアーカイブ

Enhancing knowledge retention for continual learning with domain-specific adapters and features gating

要約 継続的な学習により、モデルは、以前に獲得した知識を保存しながら、壊滅的な忘 … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhancing knowledge retention for continual learning with domain-specific adapters and features gating はコメントを受け付けていません

Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition

要約 手書きのテキスト認識(HTR)は、ドキュメント分析とデジタル化に不可欠です … 続きを読む

カテゴリー: cs.CV | Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition はコメントを受け付けていません

Efficient Mixture of Geographical Species for On Device Wildlife Monitoring

要約 効率的なオンデバイスモデルは、生態学的保全コミュニティにとって特に興味深い … 続きを読む

カテゴリー: cs.CV | Efficient Mixture of Geographical Species for On Device Wildlife Monitoring はコメントを受け付けていません

Task-conditioned Ensemble of Expert Models for Continuous Learning

要約 機械学習における主要な課題の1つは、非定常環境で展開モデル(分類器など)の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Task-conditioned Ensemble of Expert Models for Continuous Learning はコメントを受け付けていません

Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging

要約 この研究では、ケーススタディとしてADNIデータベースからの脳MRを使用し … 続きを読む

カテゴリー: (Primary), 41A05, 41A10, 65D05, 65D17, cs.CV | Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging はコメントを受け付けていません

Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization

要約 テキストからビデオへの最近の進歩(T2V)拡散モデルは、生成されたビデオの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization はコメントを受け付けていません

Title block detection and information extraction for enhanced building drawings search

要約 建築、エンジニアリング、および建設(AEC)業界は、建物の建設、メンテナン … 続きを読む

カテゴリー: cs.AI, cs.CV | Title block detection and information extraction for enhanced building drawings search はコメントを受け付けていません

MBE-ARI: A Multimodal Dataset Mapping Bi-directional Engagement in Animal-Robot Interaction

要約 ロボットは、ボディーランゲージ、動き、発声などの動物の複雑でマルチモーダル … 続きを読む

カテゴリー: cs.CV, cs.RO | MBE-ARI: A Multimodal Dataset Mapping Bi-directional Engagement in Animal-Robot Interaction はコメントを受け付けていません

A Multi-Modal AI System for Screening Mammography: Integrating 2D and 3D Imaging to Improve Breast Cancer Detection in a Prospective Clinical Study

要約 デジタル乳房トモシンセシス(DBT)は、フルフィールドデジタルマンモグラフ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A Multi-Modal AI System for Screening Mammography: Integrating 2D and 3D Imaging to Improve Breast Cancer Detection in a Prospective Clinical Study はコメントを受け付けていません

The Invisible EgoHand: 3D Hand Forecasting through EgoBody Pose Estimation

要約 エゴセントリックな視点からの手の動きとポーズを予測することは、人間の意図を … 続きを読む

カテゴリー: cs.CV | The Invisible EgoHand: 3D Hand Forecasting through EgoBody Pose Estimation はコメントを受け付けていません