月別アーカイブ: 2025年1月

Correctness Assessment of Code Generated by Large Language Models Using Internal Representations

投稿日: 2025年1月23日作成者: jarxiv

要約大規模言語モデル (LLM) によって生成されたコードの正確性を保証するこ … 続きを読む →

カテゴリー: cs.LG, cs.SE | コメントを受け付けていません

Des-q: a quantum algorithm to provably speedup retraining of decision trees

投稿日: 2025年1月23日作成者: jarxiv

要約デシジョンツリーは、そのシンプルさと説明可能性により、広く採用されている … 続きを読む →

カテゴリー: cs.LG, quant-ph | コメントを受け付けていません

Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL

投稿日: 2025年1月23日作成者: jarxiv

要約トランスフォーマアーキテクチャを使用した条件付きシーケンスモデリングは … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Fixed-Budget Change Point Identification in Piecewise Constant Bandits

投稿日: 2025年1月23日作成者: jarxiv

要約私たちは、期待される報酬がアクション空間 $[0,1]$ 全体に 1 つの … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Coseparable Nonnegative Tensor Factorization With T-CUR Decomposition

投稿日: 2025年1月23日作成者: jarxiv

要約 Nonnegative Matrix Factorization (NMF … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA | コメントを受け付けていません

Low-dimensional adaptation of diffusion models: Convergence in total variation

投稿日: 2025年1月23日作成者: jarxiv

要約この論文では、拡散生成モデルが (未知の) 低次元構造を利用してサンプリン … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management

投稿日: 2025年1月23日作成者: jarxiv

要約オフラインマルチエージェント強化学習 (MARL) は、安全性への懸念、 … 続きを読む →

カテゴリー: cs.LG, cs.MA | コメントを受け付けていません

Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching

投稿日: 2025年1月23日作成者: jarxiv

要約ワイヤレス接続を通じて仮想現実 (VR) ユーザーに没入型エクスペリエンス … 続きを読む →

カテゴリー: cs.IT, cs.LG, math.IT | コメントを受け付けていません

Evaluating multiple models using labeled and unlabeled data

投稿日: 2025年1月23日作成者: jarxiv

要約大規模なラベル付きデータセットが存在しない場合、機械学習分類器を評価するこ … 続きを読む →

カテゴリー: cs.CY, cs.LG | コメントを受け付けていません

The regret lower bound for communicating Markov Decision Processes

投稿日: 2025年1月23日作成者: jarxiv

要約この論文は、問題依存設定におけるエルゴーディックマルコフ決定プロセス ( … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

月別アーカイブ: 2025年1月

Correctness Assessment of Code Generated by Large Language Models Using Internal Representations

Des-q: a quantum algorithm to provably speedup retraining of decision trees

Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL

Fixed-Budget Change Point Identification in Piecewise Constant Bandits

Coseparable Nonnegative Tensor Factorization With T-CUR Decomposition

Low-dimensional adaptation of diffusion models: Convergence in total variation

An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management

Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching

Evaluating multiple models using labeled and unlabeled data

The regret lower bound for communicating Markov Decision Processes

最近の投稿

最近のコメント

アーカイブ

カテゴリー