「cs.AI」カテゴリーアーカイブ

DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation

投稿日: 2024年9月26日作成者: jarxiv

要約拡散モデルはさまざまな画像生成タスクで優れたパフォーマンスを示していますが … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design

投稿日: 2024年9月26日作成者: jarxiv

要約私たちは、エンジニアリング設計でディープジェネレーティブモデル (DGM) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis

投稿日: 2024年9月26日作成者: jarxiv

要約ボランティア地理情報 (VGI) は、その種類が豊富で、大容量で、迅速な更 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Benchmarking Domain Generalization Algorithms in Computational Pathology

投稿日: 2024年9月26日作成者: jarxiv

要約深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification

投稿日: 2024年9月26日作成者: jarxiv

要約自然信号の主観的な品質は、客観的な知覚指標で近似できます。人間の観察者の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification

投稿日: 2024年9月26日作成者: jarxiv

要約医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

LingoQA: Video Question Answering for Autonomous Driving

投稿日: 2024年9月26日作成者: jarxiv

要約自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Unveiling Ontological Commitment in Multi-Modal Foundation Models

投稿日: 2024年9月26日作成者: jarxiv

要約存在論的コミットメント、つまり使用される概念、関係、仮定は、定性的推論 ( … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation

投稿日: 2024年9月26日作成者: jarxiv

要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Attention Prompting on Image for Large Vision-Language Models

投稿日: 2024年9月26日作成者: jarxiv

要約大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation

GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design

ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis

Benchmarking Domain Generalization Algorithms in Computational Pathology

The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification

Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification

LingoQA: Video Question Answering for Autonomous Driving

Unveiling Ontological Commitment in Multi-Modal Foundation Models

Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation

Attention Prompting on Image for Large Vision-Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー