cs.AI」カテゴリーアーカイブ

GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design

要約 私たちは、エンジニアリング設計でディープジェネレーティブモデル (DGM) … 続きを読む

カテゴリー: cs.AI, cs.CV | GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design はコメントを受け付けていません

ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis

要約 ボランティア地理情報 (VGI) は、その種類が豊富で、大容量で、迅速な更 … 続きを読む

カテゴリー: cs.AI, cs.CV | ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis はコメントを受け付けていません

Benchmarking Domain Generalization Algorithms in Computational Pathology

要約 深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Benchmarking Domain Generalization Algorithms in Computational Pathology はコメントを受け付けていません

The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification

要約 自然信号の主観的な品質は、客観的な知覚指標で近似できます。 人間の観察者の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification はコメントを受け付けていません

Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification

要約 医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification はコメントを受け付けていません

LingoQA: Video Question Answering for Autonomous Driving

要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | LingoQA: Video Question Answering for Autonomous Driving はコメントを受け付けていません

Unveiling Ontological Commitment in Multi-Modal Foundation Models

要約 存在論的コミットメント、つまり使用される概念、関係、仮定は、定性的推論 ( … 続きを読む

カテゴリー: cs.AI, cs.CV | Unveiling Ontological Commitment in Multi-Modal Foundation Models はコメントを受け付けていません

Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation

要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation はコメントを受け付けていません

Attention Prompting on Image for Large Vision-Language Models

要約 大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む

カテゴリー: cs.AI, cs.CV | Attention Prompting on Image for Large Vision-Language Models はコメントを受け付けていません

Stochastic Multi-round Submodular Optimization with Budget

要約 この研究では、確率的予算付きマルチラウンド サブモジュラー最大化 (SBM … 続きを読む

カテゴリー: cs.AI, cs.DS | Stochastic Multi-round Submodular Optimization with Budget はコメントを受け付けていません