Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic Task

要約 言語モデルは驚くべき範囲の能力を示しますが、その明らかな能力の源は不明です … 続きを読む

SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm

要約 ケーブル駆動連続マニピュレーター (CDCM) により、自然開口部を介した … 続きを読む

AlphaForge: A Framework to Mine and Dynamically Combine Formulaic Alpha Factors

要約 財務データの変動性と低い信号対雑音比は、解釈可能性の必要性と相まって、アル … 続きを読む

IRCAN: Mitigating Knowledge Conflicts in LLM Generation via Identifying and Reweighting Context-Aware Neurons

要約 大規模言語モデル (LLM) は、大量のデータでトレーニングされた後、膨大 … 続きを読む

OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far?

要約 このレポートでは、次のような質問を投げかけます。OlympicArena … 続きを読む

Active Preference Inference using Language Models and Probabilistic Reasoning

要約 たとえば適切な質問をするなどして、ユーザーの好みを積極的に推測することは、 … 続きを読む

Mixture of Experts in a Mixture of RL settings

要約 専門家混合 (MoE) は、推論効率の向上、分散トレーニングへの適応性、お … 続きを読む

Graph Neural Networks for Emulation of Finite-Element Ice Dynamics in Greenland and Antarctic Ice Sheets

要約 数値モデルは物理法則に基づいて氷床力学に対する正確な解を提供しますが、偏微 … 続きを読む

Cultural Bias and Cultural Alignment of Large Language Models

要約 文化は人々の推論、行動、コミュニケーションを根本的に形作ります。 個人的お … 続きを読む

RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation

要約 現実世界の多くの意思決定問題では、対話を通じて固定されたままになる、部分的 … 続きを読む

