cs.LG」カテゴリーアーカイブ

AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation

要約 現代の大規模な言語モデル(LLMS)では、LLMアライメントは非常に重要で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation はコメントを受け付けていません

SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting

要約 トレーニングのために広範なタスク内データを必要とする従来の時系列予測方法と … 続きを読む

カテゴリー: cs.AI, cs.LG | SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting はコメントを受け付けていません

Verbalized Probabilistic Graphical Modeling

要約 人間の認知は、感覚入力を超越し、世界の理解を構成する潜在的な表現を形成する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Verbalized Probabilistic Graphical Modeling はコメントを受け付けていません

Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models

要約 モデルスープなどのモデルのマージは、さらにトレーニングをせずに異なるモデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models はコメントを受け付けていません

(How) Do Language Models Track State?

要約 トランス語モデル(LMS)は、進化する世界の観察されていない状態を追跡する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | (How) Do Language Models Track State? はコメントを受け付けていません

Anytime-Constrained Equilibria in Polynomial Time

要約 いつでも制約をマルコフゲームの設定と、いつでも制約のある平衡(ACE)の対 … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | Anytime-Constrained Equilibria in Polynomial Time はコメントを受け付けていません

Language Models can Self-Improve at State-Value Estimation for Better Search

要約 グラウンドトゥルースタスクの完了報酬またはマルチステップ推論タスクの人間の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Language Models can Self-Improve at State-Value Estimation for Better Search はコメントを受け付けていません

Wikipedia in the Era of LLMs: Evolution and Risks

要約 この論文では、ウィキペディアに対する大規模な言語モデル(LLMS)の影響の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | Wikipedia in the Era of LLMs: Evolution and Risks はコメントを受け付けていません

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

要約 人間は、ビジョンとタッチを使用して複雑な接触豊富なタスクを達成でき、環境の … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation はコメントを受け付けていません

Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises

要約 テスト時間適応(TTA)は、ソースデータにアクセスせずに、無ー化されたテス … 続きを読む

カテゴリー: cs.CV, cs.LG | Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises はコメントを受け付けていません