cs.LG」カテゴリーアーカイブ

Linear $Q$-Learning Does Not Diverge: Convergence Rates to a Bounded Set

要約 $ Q $ -Learningは、最も基本的な強化学習アルゴリズムの1つで … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Linear $Q$-Learning Does Not Diverge: Convergence Rates to a Bounded Set はコメントを受け付けていません

Learning Human-Aligned Representations with Contrastive Learning and Generative Similarity

要約 人間は効果的な表現に依存して、いくつかの例から学習し、感覚データから有用な … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.NC | Learning Human-Aligned Representations with Contrastive Learning and Generative Similarity はコメントを受け付けていません

Jackpot! Alignment as a Maximal Lottery

要約 大規模な言語モデル(LLM)を人間の価値に合わせるための標準である人間のフ … 続きを読む

カテゴリー: cs.AI, cs.LG, econ.TH | Jackpot! Alignment as a Maximal Lottery はコメントを受け付けていません

Concept-Based Explainable Artificial Intelligence: Metrics and Benchmarks

要約 コンセプトボトルネックモデル(CBMS)などの概念ベースの説明方法は、その … 続きを読む

カテゴリー: cs.AI, cs.LG | Concept-Based Explainable Artificial Intelligence: Metrics and Benchmarks はコメントを受け付けていません

UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models

要約 マルチモーダル大手言語モデル(MLLM)は視覚言語の理解に革命をもたらしま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models はコメントを受け付けていません

Synthetic User Behavior Sequence Generation with Large Language Models for Smart Homes

要約 近年、スマートホームシステムがより広範囲に及ぶにつれて、これらの環境内のセ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NI | Synthetic User Behavior Sequence Generation with Large Language Models for Smart Homes はコメントを受け付けていません

FAN: Fourier Analysis Networks

要約 MLPやトランスなどの汎用ニューラルネットワークの顕著な成功にもかかわらず … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FAN: Fourier Analysis Networks はコメントを受け付けていません

Language Bias in Self-Supervised Learning For Automatic Speech Recognition

要約 自己学習学習(SSL)は、データの高価なラベル付けを必要とせずに、大きなデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, eess.AS, eess.SP | Language Bias in Self-Supervised Learning For Automatic Speech Recognition はコメントを受け付けていません

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient

要約 モデルベースの強化学習(RL)は、ほとんどのモデルのないRLアルゴリズムを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient はコメントを受け付けていません

Wearable Accelerometer Foundation Models for Health via Knowledge Distillation

要約 最新のウェアラブルデバイスは、日常生活のさまざまな環境でさまざまなバイオシ … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.SP | Wearable Accelerometer Foundation Models for Health via Knowledge Distillation はコメントを受け付けていません