cs.AI」カテゴリーアーカイブ

Adaptive Reinforcement Learning for Unobservable Random Delays

要約 標準の強化学習(RL)の設定では、エージェントと環境の間の相互作用は通常、 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Adaptive Reinforcement Learning for Unobservable Random Delays はコメントを受け付けていません

AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment

要約 現在のサービスロボットは、限られた自然言語コミュニケーション能力、事前定義 … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO | AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment はコメントを受け付けていません

AlphaDecay:Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs

要約 重量減衰は、大規模な言語モデル(LLMS)をトレーニングするための標準的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AlphaDecay:Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs はコメントを受け付けていません

TGDPO: Harnessing Token-Level Reward Guidance for Enhancing Direct Preference Optimization

要約 人間のフィードバックからの強化学習における最近の進歩により、きめ細かいトー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TGDPO: Harnessing Token-Level Reward Guidance for Enhancing Direct Preference Optimization はコメントを受け付けていません

PredictaBoard: Benchmarking LLM Score Predictability

要約 印象的なスキルを持っているにもかかわらず、大規模な言語モデル(LLM)は予 … 続きを読む

カテゴリー: cs.AI, cs.CL, stat.ML | PredictaBoard: Benchmarking LLM Score Predictability はコメントを受け付けていません

Object-Centric Neuro-Argumentative Learning

要約 過去10年間、私たちは深い学習技術にもっと頼って重要な決定を下すため、その … 続きを読む

カテゴリー: cs.AI, cs.LG | Object-Centric Neuro-Argumentative Learning はコメントを受け付けていません

GenerationPrograms: Fine-grained Attribution with Executable Programs

要約 最近の大規模な言語モデル(LLMS)は、ソースコンディショニングされたテキ … 続きを読む

カテゴリー: cs.AI, cs.CL | GenerationPrograms: Fine-grained Attribution with Executable Programs はコメントを受け付けていません

From tools to thieves: Measuring and understanding public perceptions of AI through crowdsourced metaphors

要約 人工知能(AI)ベースのテクノロジーの増加する有病率にどのように対応しまし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | From tools to thieves: Measuring and understanding public perceptions of AI through crowdsourced metaphors はコメントを受け付けていません

No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need!

要約 私たちは、リソースの制約の下でオンラインの意思決定の問題を研究しています。 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! はコメントを受け付けていません

Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG

要約 LLMは脆弱性の検出において有望な可能性を示していますが、この研究は、脆弱 … 続きを読む

カテゴリー: cs.AI, cs.SE | Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG はコメントを受け付けていません