cs.CL」カテゴリーアーカイブ

Bridge-Coder: Unlocking LLMs’ Potential to Overcome Language Gaps in Low-Resource Code

要約 大規模言語モデル (LLM) は、Python などの高リソース プログラ … 続きを読む

カテゴリー: cs.CL | Bridge-Coder: Unlocking LLMs’ Potential to Overcome Language Gaps in Low-Resource Code はコメントを受け付けていません

Scaling Law with Learning Rate Annealing

要約 ニューラル言語モデルのクロスエントロピー損失曲線は、訓練ステップ全体にわた … 続きを読む

カテゴリー: cs.CL | Scaling Law with Learning Rate Annealing はコメントを受け付けていません

Does Data Contamination Detection Work (Well) for LLMs? A Survey and Evaluation on Detection Assumptions

要約 大規模言語モデル (LLM) は、さまざまなベンチマークにわたって優れたパ … 続きを読む

カテゴリー: cs.CL | Does Data Contamination Detection Work (Well) for LLMs? A Survey and Evaluation on Detection Assumptions はコメントを受け付けていません

RET-LLM: Towards a General Read-Write Memory for Large Language Models

要約 大規模言語モデル (LLM) は、その広範なパラメーターと包括的なデータ利 … 続きを読む

カテゴリー: cs.CL | RET-LLM: Towards a General Read-Write Memory for Large Language Models はコメントを受け付けていません

LongGenBench: Long-context Generation Benchmark

要約 現在のロングコンテキストベンチマークは主に検索ベースのテストに焦点を当てて … 続きを読む

カテゴリー: cs.AI, cs.CL | LongGenBench: Long-context Generation Benchmark はコメントを受け付けていません

GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning

要約 パラメータ効率の良い微調整 (PEFT) と検索拡張生成 (RAG) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning はコメントを受け付けていません

RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation

要約 検索拡張生成 (RAG) フレームワークは、パラメトリック知識と外部知識の … 続きを読む

カテゴリー: cs.AI, cs.CL | RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation はコメントを受け付けていません

From English-Centric to Effective Bilingual: LLMs with Custom Tokenizers for Underrepresented Languages

要約 この論文では、英語およびあらゆるターゲット言語をサポートするバイリンガルベ … 続きを読む

カテゴリー: cs.AI, cs.CL | From English-Centric to Effective Bilingual: LLMs with Custom Tokenizers for Underrepresented Languages はコメントを受け付けていません

Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets

要約 我々は、アーベル群の推論タスク(例:モジュラー加算)で訓練された、二次活性 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, math.AC, math.RA | Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets はコメントを受け付けていません

Demystifying Large Language Models for Medicine: A Primer

要約 大規模言語モデル (LLM) は、さまざまなコンテキストにわたって人間のよ … 続きを読む

カテゴリー: cs.AI, cs.CL | Demystifying Large Language Models for Medicine: A Primer はコメントを受け付けていません