cs.LG」カテゴリーアーカイブ

Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond

要約 このペーパーでは、モデル、データ、コードがすべてリリースされたLight- … 続きを読む

カテゴリー: cs.CL, cs.LG | Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond はコメントを受け付けていません

dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis

要約 Federated Learningは、医療分野で幅広い用途を持っています … 続きを読む

カテゴリー: cs.AI, cs.LG | dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis はコメントを受け付けていません

Similarity Equivariant Graph Neural Networks for Homogenization of Metamaterials

要約 柔らかく多孔質の機械的メタマテリアルは、柔らかいロボット工学、音の還元、生 … 続きを読む

カテゴリー: cond-mat.soft, cs.AI, cs.LG | Similarity Equivariant Graph Neural Networks for Homogenization of Metamaterials はコメントを受け付けていません

Fast MRI for All: Bridging Equity Gaps via Training without Raw Data Access

要約 物理主導のディープラーニング(PD-DL)アプローチは、高速磁気共鳴画像( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Fast MRI for All: Bridging Equity Gaps via Training without Raw Data Access はコメントを受け付けていません

Explainable Bayesian deep learning through input-skip Latent Binary Bayesian Neural Networks

要約 人工ニューラルネットワーク(ANN)を使用した自然現象のモデリングは、多く … 続きを読む

カテゴリー: 05A16, 60J22, 62-02, 62-09, 62F07, 62F15, 62J05, 62J12, 62J99, 62M05, 90C27, 90C59, 92D20, cs.AI, cs.LG, G.1.6, stat.CO, stat.ME, stat.ML | Explainable Bayesian deep learning through input-skip Latent Binary Bayesian Neural Networks はコメントを受け付けていません

Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation

要約 Rehnection Learning(RL)は、ロボットナビゲーションの … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation はコメントを受け付けていません

Latent Space Chain-of-Embedding Enables Output-free LLM Self-Evaluation

要約 LLMの自己評価は、展開の信頼性を大幅に改善する可能性のある応答の正確性を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Latent Space Chain-of-Embedding Enables Output-free LLM Self-Evaluation はコメントを受け付けていません

Conformal Prediction Sets for Deep Generative Models via Reduction to Conformal Regression

要約 特定の入力のブラックボックスディープ生成モデル(テキストプロンプトなど)か … 続きを読む

カテゴリー: cs.AI, cs.LG | Conformal Prediction Sets for Deep Generative Models via Reduction to Conformal Regression はコメントを受け付けていません

Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity

要約 LinformerやMambaなどのアーキテクチャは、最近、変圧器の競合的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity はコメントを受け付けていません

What is the Alignment Objective of GRPO?

要約 このメモでは、Group Policy Optimization(GRPO … 続きを読む

カテゴリー: cs.AI, cs.LG | What is the Alignment Objective of GRPO? はコメントを受け付けていません