-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
reBandit: Random Effects based Online RL algorithm for Reducing Cannabis Use
要約 大麻使用とそれに伴う大麻使用障害(CUD)の蔓延は、世界的に公衆衛生上の重 … 続きを読む
When Your AI Deceives You: Challenges with Partial Observability of Human Evaluators in Reward Learning
要約 人間のフィードバックからの強化学習 (RLHF) の過去の分析は、人間が環 … 続きを読む
Evaluating Very Long-Term Conversational Memory of LLM Agents
要約 長期にわたるオープンドメインの対話に関する既存の研究は、5 つ以内のチャッ … 続きを読む
Preference Ranking Optimization for Human Alignment
要約 大規模言語モデル (LLM) には誤解を招くコンテンツが含まれることが多く … 続きを読む
Dynamic fairness-aware recommendation through multi-agent social choice
要約 パーソナライズされたレコメンデーションのコンテキストにおけるアルゴリズムの … 続きを読む
カテゴリー: cs.AI
Dynamic fairness-aware recommendation through multi-agent social choice はコメントを受け付けていません
Wisdom of Committee: Distilling from Foundation Model to Specialized Application Model
要約 基礎モデルの最近の進歩により、幅広いタスクにわたって優れたパフォーマンスが … 続きを読む
Learning to Program Variational Quantum Circuits with Fast Weights
要約 量子機械学習 (QML) は、逐次制御タスクと時系列モデリングに対処する先 … 続きを読む
Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates
要約 離散最適化は、混合整数計画法や組み合わせ最適化などの分野にわたる一連の $ … 続きを読む
OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web
要約 何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む
Implicit Visual Bias Mitigation by Posterior Estimate Sharpening of a Bayesian Neural Network
要約 ディープ ニューラル ネットワークの公平性は、データセットのバイアスと偽の … 続きを読む