cs.LG」カテゴリーアーカイブ

Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data

要約 多様なデータセットを使用した大規模な言語モデル(LLMS)の微調整は、さま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data はコメントを受け付けていません

Don’t ‘Overthink’ Passage Reranking: Is Reasoning Truly Necessary?

要約 複雑な自然言語のタスクにわたる推論モデルの成功により、情報検索(IR)コミ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Don’t ‘Overthink’ Passage Reranking: Is Reasoning Truly Necessary? はコメントを受け付けていません

Slamming: Training a Speech Language Model on One GPU in a Day

要約 24時間で単一のアカデミックGPUで高品質の音声言語モデル(SLM)をトレ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Slamming: Training a Speech Language Model on One GPU in a Day はコメントを受け付けていません

Structure-Aligned Protein Language Model

要約 タンパク質言語モデル(PLMS)は、さまざまな下流タスクで優れている広大な … 続きを読む

カテゴリー: cs.AI, cs.LG | Structure-Aligned Protein Language Model はコメントを受け付けていません

WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction

要約 分子基質立体構造(すなわち、エネルギー最大の立体構造)を予測することは、分 … 続きを読む

カテゴリー: cs.AI, cs.LG, physics.chem-ph, q-bio.BM | WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction はコメントを受け付けていません

Latent Principle Discovery for Language Model Self-Improvement

要約 言語モデル(LM)ユーザーが世代の品質を向上させることを目指している場合、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Latent Principle Discovery for Language Model Self-Improvement はコメントを受け付けていません

Beyond Needle(s) in the Embodied Haystack: Environment, Architecture, and Training Considerations for Long Context Reasoning

要約 $ \ infty $ -thorを紹介します。これは、具体化されたAIで … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Beyond Needle(s) in the Embodied Haystack: Environment, Architecture, and Training Considerations for Long Context Reasoning はコメントを受け付けていません

The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm

要約 極性分解と関連するマトリックス記号関数を計算することは、数十年にわたって数 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NA, math.NA, math.OC | The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm はコメントを受け付けていません

FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records

要約 財団モデルは、ダウンストリームタスクとは無関係に意味のある表現を抽出する能 … 続きを読む

カテゴリー: cs.AI, cs.LG | FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records はコメントを受け付けていません

MixAT: Combining Continuous and Discrete Adversarial Training for LLMs

要約 大規模な言語モデル(LLMS)の安全性とアラインメントでの最近の努力にもか … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.7 | MixAT: Combining Continuous and Discrete Adversarial Training for LLMs はコメントを受け付けていません