cs.AI」カテゴリーアーカイブ

reBandit: Random Effects based Online RL algorithm for Reducing Cannabis Use

要約 大麻使用とそれに伴う大麻使用障害(CUD)の蔓延は、世界的に公衆衛生上の重 … 続きを読む

カテゴリー: cs.AI, cs.LG | reBandit: Random Effects based Online RL algorithm for Reducing Cannabis Use はコメントを受け付けていません

When Your AI Deceives You: Challenges with Partial Observability of Human Evaluators in Reward Learning

要約 人間のフィードバックからの強化学習 (RLHF) の過去の分析は、人間が環 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | When Your AI Deceives You: Challenges with Partial Observability of Human Evaluators in Reward Learning はコメントを受け付けていません

Evaluating Very Long-Term Conversational Memory of LLM Agents

要約 長期にわたるオープンドメインの対話に関する既存の研究は、5 つ以内のチャッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Evaluating Very Long-Term Conversational Memory of LLM Agents はコメントを受け付けていません

Preference Ranking Optimization for Human Alignment

要約 大規模言語モデル (LLM) には誤解を招くコンテンツが含まれることが多く … 続きを読む

カテゴリー: cs.AI, cs.CL | Preference Ranking Optimization for Human Alignment はコメントを受け付けていません

Dynamic fairness-aware recommendation through multi-agent social choice

要約 パーソナライズされたレコメンデーションのコンテキストにおけるアルゴリズムの … 続きを読む

カテゴリー: cs.AI | Dynamic fairness-aware recommendation through multi-agent social choice はコメントを受け付けていません

Wisdom of Committee: Distilling from Foundation Model to Specialized Application Model

要約 基礎モデルの最近の進歩により、幅広いタスクにわたって優れたパフォーマンスが … 続きを読む

カテゴリー: cs.AI, cs.LG | Wisdom of Committee: Distilling from Foundation Model to Specialized Application Model はコメントを受け付けていません

Learning to Program Variational Quantum Circuits with Fast Weights

要約 量子機械学習 (QML) は、逐次制御タスクと時系列モデリングに対処する先 … 続きを読む

カテゴリー: cs.AI, cs.ET, cs.LG, cs.NE, quant-ph | Learning to Program Variational Quantum Circuits with Fast Weights はコメントを受け付けていません

Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates

要約 離散最適化は、混合整数計画法や組み合わせ最適化などの分野にわたる一連の $ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates はコメントを受け付けていません

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

要約 何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web はコメントを受け付けていません

Implicit Visual Bias Mitigation by Posterior Estimate Sharpening of a Bayesian Neural Network

要約 ディープ ニューラル ネットワークの公平性は、データセットのバイアスと偽の … 続きを読む

カテゴリー: cs.AI, cs.CV | Implicit Visual Bias Mitigation by Posterior Estimate Sharpening of a Bayesian Neural Network はコメントを受け付けていません