「cs.AI」カテゴリーアーカイブ

MILES: Making Imitation Learning Easy with Self-Supervision

投稿日: 2024年10月28日作成者: jarxiv

要約模倣学習におけるデータ収集には、多くの場合、強化学習を組み込んだ手法の場合 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs

投稿日: 2024年10月28日作成者: jarxiv

要約大規模言語モデル (LLM) の微調整は、事前トレーニングされたモデルを下 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation

投稿日: 2024年10月28日作成者: jarxiv

要約未踏の環境にある物体まで効率的に移動することは、汎用知能ロボットにとって重 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.RO | コメントを受け付けていません

Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery

投稿日: 2024年10月28日作成者: jarxiv

要約このペーパーでは、スケーラブルで信頼性の高い航空予約システムの開発における … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.LG, cs.SE | コメントを受け付けていません

Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions

投稿日: 2024年10月28日作成者: jarxiv

要約オフライン環境での好みに基づく強化学習 (PBRL) は、チャットボットな … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

On Designing Effective RL Reward at Training Time for LLM Reasoning

投稿日: 2024年10月28日作成者: jarxiv

要約報酬モデルは、LLM の推論能力を向上させるためにますます重要になっていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Adversarial Environment Design via Regret-Guided Diffusion Models

投稿日: 2024年10月28日作成者: jarxiv

要約環境変化に強いエージェントをトレーニングすることは、深層強化学習 (RL) … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Automated Rewards via LLM-Generated Progress Functions

投稿日: 2024年10月28日作成者: jarxiv

要約大規模言語モデル (LLM) には、さまざまなタスクにわたって広範なドメイ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions

投稿日: 2024年10月28日作成者: jarxiv

要約マルチエージェントシステムにおける創発的な行動の背後にあるメカニズムを理解 … 続きを読む →

カテゴリー: cs.AI, cs.MA, nlin.AO | コメントを受け付けていません

Arabic Music Classification and Generation using Deep Learning

投稿日: 2024年10月28日作成者: jarxiv

要約この論文は、エジプトの古典音楽と新しい音楽を作曲家ごとに分類し、類似した新 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

MILES: Making Imitation Learning Easy with Self-Supervision

Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs

IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation

Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery

Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions

On Designing Effective RL Reward at Training Time for LLM Reasoning

Adversarial Environment Design via Regret-Guided Diffusion Models

Automated Rewards via LLM-Generated Progress Functions

Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions

Arabic Music Classification and Generation using Deep Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー