「cs.LG」カテゴリーアーカイブ

AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation

投稿日: 2025年3月5日作成者: jarxiv

要約現代の大規模な言語モデル（LLMS）では、LLMアライメントは非常に重要で … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting

投稿日: 2025年3月5日作成者: jarxiv

要約トレーニングのために広範なタスク内データを必要とする従来の時系列予測方法と … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Verbalized Probabilistic Graphical Modeling

投稿日: 2025年3月5日作成者: jarxiv

要約人間の認知は、感覚入力を超越し、世界の理解を構成する潜在的な表現を形成する … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models

投稿日: 2025年3月5日作成者: jarxiv

要約モデルスープなどのモデルのマージは、さらにトレーニングをせずに異なるモデル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

(How) Do Language Models Track State?

投稿日: 2025年3月5日作成者: jarxiv

要約トランス語モデル（LMS）は、進化する世界の観察されていない状態を追跡する … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Anytime-Constrained Equilibria in Polynomial Time

投稿日: 2025年3月5日作成者: jarxiv

要約いつでも制約をマルコフゲームの設定と、いつでも制約のある平衡（ACE）の対 … 続きを読む →

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | コメントを受け付けていません

Language Models can Self-Improve at State-Value Estimation for Better Search

投稿日: 2025年3月5日作成者: jarxiv

要約グラウンドトゥルースタスクの完了報酬またはマルチステップ推論タスクの人間の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Wikipedia in the Era of LLMs: Evolution and Risks

投稿日: 2025年3月5日作成者: jarxiv

要約この論文では、ウィキペディアに対する大規模な言語モデル（LLMS）の影響の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | コメントを受け付けていません

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

投稿日: 2025年3月5日作成者: jarxiv

要約人間は、ビジョンとタッチを使用して複雑な接触豊富なタスクを達成でき、環境の … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises

投稿日: 2025年3月5日作成者: jarxiv

要約テスト時間適応（TTA）は、ソースデータにアクセスせずに、無ー化されたテス … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation

SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting

Verbalized Probabilistic Graphical Modeling

Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models

(How) Do Language Models Track State?

Anytime-Constrained Equilibria in Polynomial Time

Language Models can Self-Improve at State-Value Estimation for Better Search

Wikipedia in the Era of LLMs: Evolution and Risks

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises

最近の投稿

最近のコメント

アーカイブ

カテゴリー