cs.LG」カテゴリーアーカイブ

Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations

要約 スタイルに基づく芸術作品のクラスタリングは、芸術作品の推薦、スタイルに基づ … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4.8 | Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations はコメントを受け付けていません

Multimodal ELBO with Diffusion Decoders

要約 マルチモーダル変分オートエンコーダは、異なるモダリティを潜在表現にマッピン … 続きを読む

カテゴリー: cs.CV, cs.LG | Multimodal ELBO with Diffusion Decoders はコメントを受け付けていません

Disentanglement with Factor Quantized Variational Autoencoders

要約 分離表現学習は、データセットの基礎となる生成因子を、互いに独立した潜在表現 … 続きを読む

カテゴリー: cs.CV, cs.LG | Disentanglement with Factor Quantized Variational Autoencoders はコメントを受け付けていません

A comparison between humans and AI at recognizing objects in unusual poses

要約 ディープラーニングは、いくつかの物体認識ベンチマークにおいて、人間の視覚と … 続きを読む

カテゴリー: cs.CV, cs.LG | A comparison between humans and AI at recognizing objects in unusual poses はコメントを受け付けていません

Understanding Model Calibration — A gentle introduction and visual exploration of calibration and the expected calibration error (ECE)

要約 モデルが信頼できるとみなされるためには、各決定における信頼度が真の結果を忠 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ME, stat.ML | Understanding Model Calibration — A gentle introduction and visual exploration of calibration and the expected calibration error (ECE) はコメントを受け付けていません

Contrast-Aware Calibration for Fine-Tuned CLIP: Leveraging Image-Text Alignment

要約 CLIPのような視覚言語モデル(VLM)は、卓越した汎化能力を実証しており … 続きを読む

カテゴリー: cs.CV, cs.LG | Contrast-Aware Calibration for Fine-Tuned CLIP: Leveraging Image-Text Alignment はコメントを受け付けていません

SELMA: A Speech-Enabled Language Model for Virtual Assistant Interactions

要約 この研究では、音声とテキストを大規模言語モデル(LLM)への入力として統合 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | SELMA: A Speech-Enabled Language Model for Virtual Assistant Interactions はコメントを受け付けていません

What is causal about causal models and representations?

要約 因果ベイズネットワークは、介入分布に関する予測を行うので、「因果」モデルで … 続きを読む

カテゴリー: cs.AI, cs.LG, math.ST, stat.ML, stat.TH | What is causal about causal models and representations? はコメントを受け付けていません

Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models

要約 実世界のシナリオにおいて、領域適応と汎化を達成することは、モデルが未知のタ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models はコメントを受け付けていません

s1: Simple test-time scaling

要約 テスト・タイム・スケーリングは、言語モデリングに対する有望な新しいアプロー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | s1: Simple test-time scaling はコメントを受け付けていません