cs.AI」カテゴリーアーカイブ

Chitrarth: Bridging Vision and Language for a Billion People

要約 最近のマルチモーダルファンデーションモデルは、主に英語または高リソースのヨ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Chitrarth: Bridging Vision and Language for a Billion People はコメントを受け付けていません

Enhancing Vehicle Make and Model Recognition with 3D Attention Modules

要約 車両の製造およびモデル認識(VMMR)は、インテリジェント輸送システムの重 … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Vehicle Make and Model Recognition with 3D Attention Modules はコメントを受け付けていません

Evaluating Multimodal Generative AI with Korean Educational Standards

要約 このペーパーでは、韓国の国家教育テストを使用してマルチモーダル生成AIシス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Evaluating Multimodal Generative AI with Korean Educational Standards はコメントを受け付けていません

Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI

要約 神経線維腫症1型は、神経線維腫(NFS)の発症を特徴とする遺伝的障害であり … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI はコメントを受け付けていません

LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection

要約 拡散モデルの進化により、画像生成の品質が劇的に向上し、実際の画像と生成され … 続きを読む

カテゴリー: cs.AI, cs.CV | LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection はコメントを受け付けていません

MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition

要約 マルチモーダルおよびマルチビューアプリケーション指向の産業部品認識の新しい … 続きを読む

カテゴリー: cs.AI, cs.CV | MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition はコメントを受け付けていません

Q-PETR: Quant-aware Position Embedding Transformation for Multi-View 3D Object Detection

要約 PETRベースの方法は、3D認識でベンチマークを支配しており、近代的な自律 … 続きを読む

カテゴリー: cs.AI, cs.CV | Q-PETR: Quant-aware Position Embedding Transformation for Multi-View 3D Object Detection はコメントを受け付けていません

UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control

要約 拡散ブリッジモデルの最近の進歩は、Doobの$ H $ transform … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SY, eess.SY | UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control はコメントを受け付けていません

Depth-aware Fusion Method based on Image and 4D Radar Spectrum for 3D Object Detection

要約 安全性と信頼性は、自律運転を一般に受け入れるために重要です。 正確で信頼で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Depth-aware Fusion Method based on Image and 4D Radar Spectrum for 3D Object Detection はコメントを受け付けていません

Bridging vision language model (VLM) evaluation gaps with a framework for scalable and cost-effective benchmark generation

要約 AIモデルの信頼できる評価は、科学的進歩と実用的な応用にとって重要です。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Bridging vision language model (VLM) evaluation gaps with a framework for scalable and cost-effective benchmark generation はコメントを受け付けていません