cs.AI」カテゴリーアーカイブ

MILES: Making Imitation Learning Easy with Self-Supervision

要約 模倣学習におけるデータ収集には、多くの場合、強化学習を組み込んだ手法の場合 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | MILES: Making Imitation Learning Easy with Self-Supervision はコメントを受け付けていません

Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs

要約 大規模言語モデル (LLM) の微調整は、事前トレーニングされたモデルを下 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs はコメントを受け付けていません

IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation

要約 未踏の環境にある物体まで効率的に移動することは、汎用知能ロボットにとって重 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation はコメントを受け付けていません

Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery

要約 このペーパーでは、スケーラブルで信頼性の高い航空予約システムの開発における … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG, cs.SE | Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery はコメントを受け付けていません

Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions

要約 オフライン環境での好みに基づく強化学習 (PBRL) は、チャットボットな … 続きを読む

カテゴリー: cs.AI, cs.LG | Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions はコメントを受け付けていません

On Designing Effective RL Reward at Training Time for LLM Reasoning

要約 報酬モデルは、LLM の推論能力を向上させるためにますます重要になっていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | On Designing Effective RL Reward at Training Time for LLM Reasoning はコメントを受け付けていません

Adversarial Environment Design via Regret-Guided Diffusion Models

要約 環境変化に強いエージェントをトレーニングすることは、深層強化学習 (RL) … 続きを読む

カテゴリー: cs.AI, cs.LG | Adversarial Environment Design via Regret-Guided Diffusion Models はコメントを受け付けていません

Automated Rewards via LLM-Generated Progress Functions

要約 大規模言語モデル (LLM) には、さまざまなタスクにわたって広範なドメイ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Automated Rewards via LLM-Generated Progress Functions はコメントを受け付けていません

Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions

要約 マルチエージェントシステムにおける創発的な行動の背後にあるメカニズムを理解 … 続きを読む

カテゴリー: cs.AI, cs.MA, nlin.AO | Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions はコメントを受け付けていません

Arabic Music Classification and Generation using Deep Learning

要約 この論文は、エジプトの古典音楽と新しい音楽を作曲家ごとに分類し、類似した新 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Arabic Music Classification and Generation using Deep Learning はコメントを受け付けていません