月別アーカイブ: 2023年2月

CAMEO: Curiosity Augmented Metropolis for Exploratory Optimal Policies

要約 強化学習は、最適制御問題を解決するためのツールとして大きな関心を集めていま … 続きを読む

カテゴリー: cs.AI, cs.LG | CAMEO: Curiosity Augmented Metropolis for Exploratory Optimal Policies はコメントを受け付けていません

Online Double Oracle

要約 巨大なアクション スペースを使用して戦略的なゲームを解決することは、経済学 … 続きを読む

カテゴリー: cs.AI, cs.GT | Online Double Oracle はコメントを受け付けていません

Exploiting No-Regret Algorithms in System Design

要約 コラム プレイヤーがシステムの設計者でもあり、ペイオフ マトリックスの設計 … 続きを読む

カテゴリー: cs.AI, cs.GT | Exploiting No-Regret Algorithms in System Design はコメントを受け付けていません

Word class representations spontaneously emerge in a deep neural network trained on next word prediction

要約 人間はどのようにして言語を習得するのでしょうか?最初の言語はそもそも習得で … 続きを読む

カテゴリー: cs.AI, cs.CL, q-bio.NC | Word class representations spontaneously emerge in a deep neural network trained on next word prediction はコメントを受け付けていません

Deep Learning for Hybrid Beamforming with Finite Feedback in GSM Aided mmWave MIMO Systems

要約 ハイブリッド ビームフォーミングは、ミリ波 (mmWave) 多入力多出力 … 続きを読む

カテゴリー: cs.AI, cs.IT, eess.SP, math.IT | Deep Learning for Hybrid Beamforming with Finite Feedback in GSM Aided mmWave MIMO Systems はコメントを受け付けていません

Frameworks for SNNs: a Review of Data Science-oriented Software and an Expansion of SpykeTorch

要約 ニューロモルフィック (NM) 分野で機械学習 (ML) アプリケーション … 続きを読む

カテゴリー: cs.AI, cs.NE, cs.SE | Frameworks for SNNs: a Review of Data Science-oriented Software and an Expansion of SpykeTorch はコメントを受け付けていません

Efficient Online Reinforcement Learning with Offline Data

要約 サンプルの効率と探索は、オンライン強化学習 (RL) における主要な課題の … 続きを読む

カテゴリー: cs.AI, cs.LG | Efficient Online Reinforcement Learning with Offline Data はコメントを受け付けていません

Reinforcement Learning Based Power Grid Day-Ahead Planning and AI-Assisted Control

要約 再生可能エネルギーへの継続的な移行により、風力や太陽光などの変動する電源の … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY | Reinforcement Learning Based Power Grid Day-Ahead Planning and AI-Assisted Control はコメントを受け付けていません

Genetic multi-armed bandits: a reinforcement learning approach for discrete optimization via simulation

要約 この論文では、GMAB と呼ばれる新しいアルゴリズムを提案します。このアル … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, econ.GN, math.OC, q-fin.EC | Genetic multi-armed bandits: a reinforcement learning approach for discrete optimization via simulation はコメントを受け付けていません

Prioritized offline Goal-swapping Experience Replay

要約 目標条件付きオフライン強化学習では、エージェントは以前に収集されたデータか … 続きを読む

カテゴリー: cs.AI, cs.LG | Prioritized offline Goal-swapping Experience Replay はコメントを受け付けていません