月別アーカイブ: 2025年1月

Correctness Assessment of Code Generated by Large Language Models Using Internal Representations

要約 大規模言語モデル (LLM) によって生成されたコードの正確性を保証するこ … 続きを読む

カテゴリー: cs.LG, cs.SE | Correctness Assessment of Code Generated by Large Language Models Using Internal Representations はコメントを受け付けていません

Des-q: a quantum algorithm to provably speedup retraining of decision trees

要約 デシジョン ツリーは、そのシンプルさと説明可能性により、広く採用されている … 続きを読む

カテゴリー: cs.LG, quant-ph | Des-q: a quantum algorithm to provably speedup retraining of decision trees はコメントを受け付けていません

Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL

要約 トランスフォーマ アーキテクチャを使用した条件付きシーケンス モデリングは … 続きを読む

カテゴリー: cs.LG | Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL はコメントを受け付けていません

Fixed-Budget Change Point Identification in Piecewise Constant Bandits

要約 私たちは、期待される報酬がアクション空間 $[0,1]$ 全体に 1 つの … 続きを読む

カテゴリー: cs.LG, stat.ML | Fixed-Budget Change Point Identification in Piecewise Constant Bandits はコメントを受け付けていません

Coseparable Nonnegative Tensor Factorization With T-CUR Decomposition

要約 Nonnegative Matrix Factorization (NMF … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA | Coseparable Nonnegative Tensor Factorization With T-CUR Decomposition はコメントを受け付けていません

Low-dimensional adaptation of diffusion models: Convergence in total variation

要約 この論文では、拡散生成モデルが (未知の) 低次元構造を利用してサンプリン … 続きを読む

カテゴリー: cs.LG, stat.ML | Low-dimensional adaptation of diffusion models: Convergence in total variation はコメントを受け付けていません

An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management

要約 オフライン マルチエージェント強化学習 (MARL) は、安全性への懸念、 … 続きを読む

カテゴリー: cs.LG, cs.MA | An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management はコメントを受け付けていません

Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching

要約 ワイヤレス接続を通じて仮想現実 (VR) ユーザーに没入型エクスペリエンス … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT | Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching はコメントを受け付けていません

Evaluating multiple models using labeled and unlabeled data

要約 大規模なラベル付きデータセットが存在しない場合、機械学習分類器を評価するこ … 続きを読む

カテゴリー: cs.CY, cs.LG | Evaluating multiple models using labeled and unlabeled data はコメントを受け付けていません

The regret lower bound for communicating Markov Decision Processes

要約 この論文は、問題依存設定におけるエルゴーディック マルコフ決定プロセス ( … 続きを読む

カテゴリー: cs.LG, stat.ML | The regret lower bound for communicating Markov Decision Processes はコメントを受け付けていません