cs.CL」カテゴリーアーカイブ

DiaSynth: Synthetic Dialogue Generation Framework for Low Resource Dialogue Applications

要約 ドメイン固有のダイアログデータセットの希少性により、アプリケーション全体の … 続きを読む

カテゴリー: cs.CL, cs.LG | DiaSynth: Synthetic Dialogue Generation Framework for Low Resource Dialogue Applications はコメントを受け付けていません

In-Context Learning (and Unlearning) of Length Biases

要約 大規模な言語モデルは、模範的な入出力のペアリングがデモンストレーションのプ … 続きを読む

カテゴリー: cs.CL | In-Context Learning (and Unlearning) of Length Biases はコメントを受け付けていません

Who Taught You That? Tracing Teachers in Model Distillation

要約 モデルの蒸留 – 大規模な教師モデルからの出力を使用して小さな … 続きを読む

カテゴリー: cs.CL | Who Taught You That? Tracing Teachers in Model Distillation はコメントを受け付けていません

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

要約 システムドメインに特化した効率的な大規模な言語モデルであるSigmaを紹介 … 続きを読む

カテゴリー: cs.CL | Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models はコメントを受け付けていません

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

要約 テスト時間スケーリング(TTS)は、推論フェーズ中に追加の計算を使用するこ … 続きを読む

カテゴリー: cs.CL | Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling はコメントを受け付けていません

Diverse Preference Optimization

要約 補強学習、好みの最適化、または監視された微調整のいずれかを通じて、言語モデ … 続きを読む

カテゴリー: cs.CL | Diverse Preference Optimization はコメントを受け付けていません

Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts

要約 医療の大規模な言語モデルをローカル言語に適応させると、医療サービスへのアク … 続きを読む

カテゴリー: cs.CL | Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts はコメントを受け付けていません

Exploiting Sparsity for Long Context Inference: Million Token Contexts on Commodity GPUs

要約 訓練されたトランスモデルに数十万の入力トークンを使用して、推論を実行する需 … 続きを読む

カテゴリー: cs.CL | Exploiting Sparsity for Long Context Inference: Million Token Contexts on Commodity GPUs はコメントを受け付けていません

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

要約 スケーリングの思考テンプレートを介して階層的なLLM推論が推論検索スペース … 続きを読む

カテゴリー: cs.CL | ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates はコメントを受け付けていません

Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data

要約 フリーテキストの応答は、一般的に心理学的研究で収集され、定量的対策がキャプ … 続きを読む

カテゴリー: cs.CL | Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data はコメントを受け付けていません