-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
「cs.LG」カテゴリーアーカイブ
Faster Algorithms for Agnostically Learning Disjunctions and their Implications
要約 分布のない不可知論PACモデルでブールの分離を学習するというアルゴリズムタ … 続きを読む
Explorable INR: An Implicit Neural Representation for Ensemble Simulation Enabling Efficient Spatial and Parameter Exploration
要約 宇宙論や海洋学などの科学的分野での高解像度のアンサンブルシミュレーションで … 続きを読む
On Learning Parallel Pancakes with Mostly Uniform Weights
要約 $ \ mathbb {r}^d $でガウスの$ k $ -mixture … 続きを読む
ASIDE: Architectural Separation of Instructions and Data in Language Models
要約 彼らの驚くべきパフォーマンスにもかかわらず、大規模な言語モデルには基本的な … 続きを読む
A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis
要約 データの統合と蒸留は、小言語モデルを強化するための有望な戦略ですが、現在の … 続きを読む
Learning to Reason under Off-Policy Guidance
要約 大規模な推論モデル(LRMS)の最近の進歩は、マルチステップ推論や自己反省 … 続きを読む
Speaker Fuzzy Fingerprints: Benchmarking Text-Based Identification in Multiparty Dialogues
要約 音声録音を使用したスピーカーの識別は、一意のアコースティック機能を活用しま … 続きを読む
Context-Parametric Inversion: Why Instruction Finetuning Can Worsen Context Reliance
要約 大規模な言語モデルを使用する場合の標準的な練習は、ユーザーがモデルを処理す … 続きを読む
Semantic Wave Functions: Exploring Meaning in Large Language Models Through Quantum Formalism
要約 大規模な言語モデル(LLM)は、高次元ベクトル埋め込みでセマンティック関係 … 続きを読む
Fully Bayesian Approaches to Topics over Time
要約 時間の経過とともにトピック(TOT)モデルは、Word共起パターンと共同で … 続きを読む