cs.LG」カテゴリーアーカイブ

Soft Checksums to Flag Untrustworthy Machine Learning Surrogate Predictions and Application to Atomic Physics Simulations

要約 トレーニング済みニューラル ネットワーク (NN) は、物理シミュレーショ … 続きを読む

カテゴリー: cs.LG, physics.atom-ph | Soft Checksums to Flag Untrustworthy Machine Learning Surrogate Predictions and Application to Atomic Physics Simulations はコメントを受け付けていません

Towards Time Series Reasoning with LLMs

要約 マルチモーダル大規模言語モデル (MLLM) により、視覚などの領域におけ … 続きを読む

カテゴリー: cs.LG | Towards Time Series Reasoning with LLMs はコメントを受け付けていません

Self-test loss functions for learning weak-form operators and gradient flows

要約 損失関数の構築は、特にテスト関数を適切に選択する必要があるため、偏微分方程 … 続きを読む

カテゴリー: cs.LG, stat.ML | Self-test loss functions for learning weak-form operators and gradient flows はコメントを受け付けていません

DynaMITE-RL: A Dynamic Model for Improved Temporal Meta-Reinforcement Learning

要約 潜在状態がさまざまな速度で進化する環境で近似推論を行うためのメタ強化学習 … 続きを読む

カテゴリー: cs.LG | DynaMITE-RL: A Dynamic Model for Improved Temporal Meta-Reinforcement Learning はコメントを受け付けていません

Adaptive Dense Reward: Understanding the Gap Between Action and Reward Space in Alignment

要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Adaptive Dense Reward: Understanding the Gap Between Action and Reward Space in Alignment はコメントを受け付けていません

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

要約 大規模言語モデル (LLM) の知識メカニズムを理解することは、信頼できる … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | Knowledge Mechanisms in Large Language Models: A Survey and Perspective はコメントを受け付けていません

Elephants Never Forget: Memorization and Learning of Tabular Data in Large Language Models

要約 大規模言語モデル (LLM) をさまざまなタスクにどのように適用できるかは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Elephants Never Forget: Memorization and Learning of Tabular Data in Large Language Models はコメントを受け付けていません

GWQ: Gradient-Aware Weight Quantization for Large Language Models

要約 大規模言語モデル (LLM) は、複雑な言語タスクを解決する際に優れたパフ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GWQ: Gradient-Aware Weight Quantization for Large Language Models はコメントを受け付けていません

Automatically Interpreting Millions of Features in Large Language Models

要約 ディープ ニューラル ネットワークにおけるニューロンの活性化には通常、人間 … 続きを読む

カテゴリー: cs.CL, cs.LG | Automatically Interpreting Millions of Features in Large Language Models はコメントを受け付けていません

FANAL — Financial Activity News Alerting Language Modeling Framework

要約 急速に進化する金融セクターでは、予測不可能な出来事に対処する必要があるステ … 続きを読む

カテゴリー: (Primary), 68T50, 91F20, 91G15, cs.CL, cs.LG, H.3.3 | FANAL — Financial Activity News Alerting Language Modeling Framework はコメントを受け付けていません