「cs.LG」カテゴリーアーカイブ

Linear $Q$-Learning Does Not Diverge: Convergence Rates to a Bounded Set

投稿日: 2025年2月3日作成者: jarxiv

要約 $ Q $ -Learningは、最も基本的な強化学習アルゴリズムの1つで … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Learning Human-Aligned Representations with Contrastive Learning and Generative Similarity

投稿日: 2025年2月3日作成者: jarxiv

要約人間は効果的な表現に依存して、いくつかの例から学習し、感覚データから有用な … 続きを読む →

カテゴリー: cs.AI, cs.LG, q-bio.NC | コメントを受け付けていません

Jackpot! Alignment as a Maximal Lottery

投稿日: 2025年2月3日作成者: jarxiv

要約大規模な言語モデル（LLM）を人間の価値に合わせるための標準である人間のフ … 続きを読む →

カテゴリー: cs.AI, cs.LG, econ.TH | コメントを受け付けていません

Concept-Based Explainable Artificial Intelligence: Metrics and Benchmarks

投稿日: 2025年2月3日作成者: jarxiv

要約コンセプトボトルネックモデル（CBMS）などの概念ベースの説明方法は、その … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models

投稿日: 2025年2月3日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）は視覚言語の理解に革命をもたらしま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Synthetic User Behavior Sequence Generation with Large Language Models for Smart Homes

投稿日: 2025年2月3日作成者: jarxiv

要約近年、スマートホームシステムがより広範囲に及ぶにつれて、これらの環境内のセ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NI | コメントを受け付けていません

FAN: Fourier Analysis Networks

投稿日: 2025年2月3日作成者: jarxiv

要約 MLPやトランスなどの汎用ニューラルネットワークの顕著な成功にもかかわらず … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Language Bias in Self-Supervised Learning For Automatic Speech Recognition

投稿日: 2025年2月3日作成者: jarxiv

要約自己学習学習（SSL）は、データの高価なラベル付けを必要とせずに、大きなデ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, eess.AS, eess.SP | コメントを受け付けていません

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient

投稿日: 2025年2月3日作成者: jarxiv

要約モデルベースの強化学習（RL）は、ほとんどのモデルのないRLアルゴリズムを … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Wearable Accelerometer Foundation Models for Health via Knowledge Distillation

投稿日: 2025年2月3日作成者: jarxiv

要約最新のウェアラブルデバイスは、日常生活のさまざまな環境でさまざまなバイオシ … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.SP | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Linear $Q$-Learning Does Not Diverge: Convergence Rates to a Bounded Set

Learning Human-Aligned Representations with Contrastive Learning and Generative Similarity

Jackpot! Alignment as a Maximal Lottery

Concept-Based Explainable Artificial Intelligence: Metrics and Benchmarks

UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models

Synthetic User Behavior Sequence Generation with Large Language Models for Smart Homes

FAN: Fourier Analysis Networks

Language Bias in Self-Supervised Learning For Automatic Speech Recognition

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient

Wearable Accelerometer Foundation Models for Health via Knowledge Distillation

最近の投稿

最近のコメント

アーカイブ

カテゴリー