cs.LG」カテゴリーアーカイブ

Cooperative Cruising: Reinforcement Learning based Time-Headway Control for Increased Traffic Efficiency

要約 コネクテッド自動運転車の普及は、運転効率を向上させ、交通渋滞を緩和する前例 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA, cs.SY, eess.SY | Cooperative Cruising: Reinforcement Learning based Time-Headway Control for Increased Traffic Efficiency はコメントを受け付けていません

Introduction to Reinforcement Learning

要約 人工知能(AI)の一分野である強化学習(RL)は、累積報酬を最大化するため … 続きを読む

カテゴリー: cs.AI, cs.LG | Introduction to Reinforcement Learning はコメントを受け付けていません

Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes

要約 平均報酬マルコフ決定過程(MDP)は、不確実性の下で逐次的な意思決定を行う … 続きを読む

カテゴリー: cs.AI, cs.LG | Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes はコメントを受け付けていません

TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning

要約 敵対的なシナリオで行動する自律エージェントは、時間的制約の中で特定の目的地 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA, cs.RO, cs.SY, eess.SY | TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning はコメントを受け付けていません

Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients

要約 オートエンコーダやシャムネットワークのような人工ニューラルネットワークが、 … 続きを読む

カテゴリー: cs.AI, cs.LG | Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients はコメントを受け付けていません

Filtered Direct Preference Optimization

要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Filtered Direct Preference Optimization はコメントを受け付けていません

CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs

要約 本稿では、小型言語モデル(SLM)と視覚言語モデル(VLM)の性能を分析し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs はコメントを受け付けていません

Medical Multimodal Foundation Models in Clinical Diagnosis and Treatment: Applications, Challenges, and Future Directions

要約 近年のディープラーニングの進歩は、臨床診断・治療の分野に大きな変革をもたら … 続きを読む

カテゴリー: cs.AI, cs.LG | Medical Multimodal Foundation Models in Clinical Diagnosis and Treatment: Applications, Challenges, and Future Directions はコメントを受け付けていません

Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Environments with Delayed Rewards

要約 本稿では、強化学習(RL)における遅延報酬という難題に取り組む。プロキシマ … 続きを読む

カテゴリー: cs.AI, cs.LG | Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Environments with Delayed Rewards はコメントを受け付けていません

From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs

要約 近年の大規模言語モデルの進歩により、そのコンテキストウィンドウは大幅に改善 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs はコメントを受け付けていません