cs.LG」カテゴリーアーカイブ

Constructing Domain-Specific Evaluation Sets for LLM-as-a-judge

要約 大規模言語モデル (LLM) は機械学習の状況に革命をもたらしましたが、現 … 続きを読む

カテゴリー: cs.AI, cs.LG | Constructing Domain-Specific Evaluation Sets for LLM-as-a-judge はコメントを受け付けていません

PEDAL: Enhancing Greedy Decoding with Large Language Models using Diverse Exemplars

要約 Self-Consistency などの多様な推論パスを備えた自己アンサン … 続きを読む

カテゴリー: cs.CL, cs.LG | PEDAL: Enhancing Greedy Decoding with Large Language Models using Diverse Exemplars はコメントを受け付けていません

Deep Reinforcement Learning for Robotics: A Survey of Real-World Successes

要約 強化学習 (RL)、特にディープ RL (DRL) と呼ばれるディープ ニ … 続きを読む

カテゴリー: cs.LG, cs.RO | Deep Reinforcement Learning for Robotics: A Survey of Real-World Successes はコメントを受け付けていません

FedRobo: Federated Learning Driven Autonomous Inter Robots Communication For Optimal Chemical Sprays

要約 フェデレーテッド ラーニングにより、ロボットは一元化されたデータ収集に依存 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG, cs.RO | FedRobo: Federated Learning Driven Autonomous Inter Robots Communication For Optimal Chemical Sprays はコメントを受け付けていません

D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning

要約 オフライン強化学習アルゴリズムは、コストがかかる、または危険な現実世界の探 … 続きを読む

カテゴリー: cs.LG, cs.RO | D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning はコメントを受け付けていません

MMP++: Motion Manifold Primitives with Parametric Curve Models

要約 基本的なモーション スキルをエンコードするための多様体ベースのアプローチで … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | MMP++: Motion Manifold Primitives with Parametric Curve Models はコメントを受け付けていません

AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights

要約 ナビゲーションの精度、速度、安定性は、安全な UAV 飛行操縦と動的な環境 … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights はコメントを受け付けていません

S-RAF: A Simulation-Based Robustness Assessment Framework for Responsible Autonomous Driving

要約 人工知能 (AI) テクノロジーが進歩するにつれて、AI 駆動システムの堅 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG, cs.RO | S-RAF: A Simulation-Based Robustness Assessment Framework for Responsible Autonomous Driving はコメントを受け付けていません

RBLA: Rank-Based-LoRA-Aggregation for Fine-tuning Heterogeneous Models in FLaaS

要約 Federated Learning (FL) は、携帯電話、デスクトップ … 続きを読む

カテゴリー: cs.DC, cs.LG | RBLA: Rank-Based-LoRA-Aggregation for Fine-tuning Heterogeneous Models in FLaaS はコメントを受け付けていません

Efficient Multi-Policy Evaluation for Reinforcement Learning

要約 複数のターゲット ポリシーを公平に評価するために、RL 実践者の間で主流の … 続きを読む

カテゴリー: cs.LG | Efficient Multi-Policy Evaluation for Reinforcement Learning はコメントを受け付けていません