「cs.CL」カテゴリーアーカイブ

DiaSynth: Synthetic Dialogue Generation Framework for Low Resource Dialogue Applications

投稿日: 2025年2月11日作成者: jarxiv

要約ドメイン固有のダイアログデータセットの希少性により、アプリケーション全体の … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

In-Context Learning (and Unlearning) of Length Biases

投稿日: 2025年2月11日作成者: jarxiv

要約大規模な言語モデルは、模範的な入出力のペアリングがデモンストレーションのプ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Who Taught You That? Tracing Teachers in Model Distillation

投稿日: 2025年2月11日作成者: jarxiv

要約モデルの蒸留 – 大規模な教師モデルからの出力を使用して小さな … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

投稿日: 2025年2月11日作成者: jarxiv

要約システムドメインに特化した効率的な大規模な言語モデルであるSigmaを紹介 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

投稿日: 2025年2月11日作成者: jarxiv

要約テスト時間スケーリング（TTS）は、推論フェーズ中に追加の計算を使用するこ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Diverse Preference Optimization

投稿日: 2025年2月11日作成者: jarxiv

要約補強学習、好みの最適化、または監視された微調整のいずれかを通じて、言語モデ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts

投稿日: 2025年2月11日作成者: jarxiv

要約医療の大規模な言語モデルをローカル言語に適応させると、医療サービスへのアク … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Exploiting Sparsity for Long Context Inference: Million Token Contexts on Commodity GPUs

投稿日: 2025年2月11日作成者: jarxiv

要約訓練されたトランスモデルに数十万の入力トークンを使用して、推論を実行する需 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

投稿日: 2025年2月11日作成者: jarxiv

要約スケーリングの思考テンプレートを介して階層的なLLM推論が推論検索スペース … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data

投稿日: 2025年2月11日作成者: jarxiv

要約フリーテキストの応答は、一般的に心理学的研究で収集され、定量的対策がキャプ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

DiaSynth: Synthetic Dialogue Generation Framework for Low Resource Dialogue Applications

In-Context Learning (and Unlearning) of Length Biases

Who Taught You That? Tracing Teachers in Model Distillation

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Diverse Preference Optimization

Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts

Exploiting Sparsity for Long Context Inference: Million Token Contexts on Commodity GPUs

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data

最近の投稿

最近のコメント

アーカイブ

カテゴリー