cs.AI」カテゴリーアーカイブ

Efficient Dynamic Shielding for Parametric Safety Specifications

要約 シールドは、AI制御された自律システムの安全性を確保するための有望なアプロ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.LO, cs.RO, cs.SY, eess.SY | Efficient Dynamic Shielding for Parametric Safety Specifications はコメントを受け付けていません

JEDI: Latent End-to-end Diffusion Mitigates Agent-Human Performance Asymmetry in Model-Based Reinforcement Learning

要約 モデルベースの強化学習(MBRL)の最近の進歩は、強力な拡散ワールドモデル … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | JEDI: Latent End-to-end Diffusion Mitigates Agent-Human Performance Asymmetry in Model-Based Reinforcement Learning はコメントを受け付けていません

A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems

要約 自律システムが日常生活でより遍在するようになるにつれて、安全性を保証する高 … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY | A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems はコメントを受け付けていません

Sample Efficient Robot Learning in Supervised Effect Prediction Tasks

要約 自己教師のロボット学習では、エージェントは環境との積極的な相互作用、エネル … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Sample Efficient Robot Learning in Supervised Effect Prediction Tasks はコメントを受け付けていません

Gender-Neutral Large Language Models for Medical Applications: Reducing Bias in PubMed Abstracts

要約 このペーパーでは、性別の職業代名詞を中和することにより医学文献で使用される … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Gender-Neutral Large Language Models for Medical Applications: Reducing Bias in PubMed Abstracts はコメントを受け付けていません

Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

要約 トレーニング後の段階でのマルチモーダル大手言語モデル(MLLMS)の改善は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO はコメントを受け付けていません

How Do LLMs Perform Two-Hop Reasoning in Context?

要約 「ソクラテスは人間です。 すべての人間は致命的です。 したがって、ソクラテ … 続きを読む

カテゴリー: cs.AI, cs.CL | How Do LLMs Perform Two-Hop Reasoning in Context? はコメントを受け付けていません

Human-Centered Human-AI Collaboration (HCHAC)

要約 インテリジェントな時代において、人間とインテリジェントシステムとの相互作用 … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC | Human-Centered Human-AI Collaboration (HCHAC) はコメントを受け付けていません

Position: Don’t Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints

要約 有効なエラーバーや有意性テストを含む、大規模な言語モデル(LLM)の厳密な … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Position: Don’t Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints はコメントを受け付けていません

Learned Collusion

要約 Qラーニングは、利用可能な各アクションに関連付けられた継続値の推定値(Q値 … 続きを読む

カテゴリー: cs.AI, cs.GT, econ.TH | Learned Collusion はコメントを受け付けていません