cs.LG」カテゴリーアーカイブ

Can GPT Improve the State of Prior Authorization via Guideline Based Automated Question Answering?

要約 健康保険会社には、事前承認 (PA) と呼ばれる定義されたプロセスがありま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Can GPT Improve the State of Prior Authorization via Guideline Based Automated Question Answering? はコメントを受け付けていません

Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead

要約 低ランク適応 (LoRA) を使用して大規模言語モデル (LLM) を微調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead はコメントを受け付けていません

Can GPT Redefine Medical Understanding? Evaluating GPT on Biomedical Machine Reading Comprehension

要約 大規模言語モデル (LLM) は、さまざまなドメインの多くのタスクで顕著な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Can GPT Redefine Medical Understanding? Evaluating GPT on Biomedical Machine Reading Comprehension はコメントを受け付けていません

MILES: Making Imitation Learning Easy with Self-Supervision

要約 模倣学習におけるデータ収集には、多くの場合、強化学習を組み込んだ手法の場合 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | MILES: Making Imitation Learning Easy with Self-Supervision はコメントを受け付けていません

Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs

要約 大規模言語モデル (LLM) の微調整は、事前トレーニングされたモデルを下 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs はコメントを受け付けていません

Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery

要約 このペーパーでは、スケーラブルで信頼性の高い航空予約システムの開発における … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG, cs.SE | Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery はコメントを受け付けていません

Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions

要約 オフライン環境での好みに基づく強化学習 (PBRL) は、チャットボットな … 続きを読む

カテゴリー: cs.AI, cs.LG | Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions はコメントを受け付けていません

On Designing Effective RL Reward at Training Time for LLM Reasoning

要約 報酬モデルは、LLM の推論能力を向上させるためにますます重要になっていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | On Designing Effective RL Reward at Training Time for LLM Reasoning はコメントを受け付けていません

Adversarial Environment Design via Regret-Guided Diffusion Models

要約 環境変化に強いエージェントをトレーニングすることは、深層強化学習 (RL) … 続きを読む

カテゴリー: cs.AI, cs.LG | Adversarial Environment Design via Regret-Guided Diffusion Models はコメントを受け付けていません

Automated Rewards via LLM-Generated Progress Functions

要約 大規模言語モデル (LLM) には、さまざまなタスクにわたって広範なドメイ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Automated Rewards via LLM-Generated Progress Functions はコメントを受け付けていません