cs.LG」カテゴリーアーカイブ

Grasp, See and Place: Efficient Unknown Object Rearrangement with Policy Structure Prior

要約 私たちは未知のオブジェクトの再配置のタスクに焦点を当てます。このタスクでは … 続きを読む

カテゴリー: cs.LG, cs.RO | Grasp, See and Place: Efficient Unknown Object Rearrangement with Policy Structure Prior はコメントを受け付けていません

Sparks of Quantum Advantage and Rapid Retraining in Machine Learning

要約 量子コンピューティングの出現は、古典的なコンピュータよりも効率的に複雑な問 … 続きを読む

カテゴリー: cs.ET, cs.LG, quant-ph, stat.ML | Sparks of Quantum Advantage and Rapid Retraining in Machine Learning はコメントを受け付けていません

End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control

要約 (経済的) 非線形モデル予測制御 ((e)NMPC) には、十分に正確で計 … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY | End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control はコメントを受け付けていません

Jumping Ahead: Improving Reconstruction Fidelity with JumpReLU Sparse Autoencoders

要約 スパース オートエンコーダ (SAE) は、言語モデル (LM) のアクテ … 続きを読む

カテゴリー: cs.LG | Jumping Ahead: Improving Reconstruction Fidelity with JumpReLU Sparse Autoencoders はコメントを受け付けていません

Improving Retrieval for RAG based Question Answering Models on Financial Documents

要約 正確な応答を生成する際の大規模言語モデル (LLM) の有効性は、特に検索 … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG, q-fin.GN | Improving Retrieval for RAG based Question Answering Models on Financial Documents はコメントを受け付けていません

ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition

要約 自己注意は大規模言語モデル (LLM) の重要なコンポーネントですが、長い … 続きを読む

カテゴリー: cs.CL, cs.LG | ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition はコメントを受け付けていません

Generalization in Neural Networks: A Broad Survey

要約 このペーパーでは、(1) サンプル、(2) ディストリビューション、(3) … 続きを読む

カテゴリー: cs.AI, cs.LG | Generalization in Neural Networks: A Broad Survey はコメントを受け付けていません

Learning Backdoors for Mixed Integer Linear Programs with Contrastive Learning

要約 現実世界の問題の多くは、混合整数線形計画法 (MILP) として効率的にモ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Learning Backdoors for Mixed Integer Linear Programs with Contrastive Learning はコメントを受け付けていません

Dataset Distillation for Offline Reinforcement Learning

要約 オフライン強化学習では、多くの場合、ポリシーをトレーニングできる高品質のデ … 続きを読む

カテゴリー: cs.AI, cs.LG | Dataset Distillation for Offline Reinforcement Learning はコメントを受け付けていません

Enhancing Stability for Large Models Training in Constrained Bandwidth Networks

要約 数十億のパラメータを使用して非常に大規模な言語モデルをトレーニングすること … 続きを読む

カテゴリー: cs.AI, cs.LG | Enhancing Stability for Large Models Training in Constrained Bandwidth Networks はコメントを受け付けていません