cs.CL」カテゴリーアーカイブ

CoSy: Evaluating Textual Explanations of Neurons

要約 ディープ ニューラル ネットワーク (DNN) の複雑な性質を理解する上で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CoSy: Evaluating Textual Explanations of Neurons はコメントを受け付けていません

Densing Law of LLMs

要約 大規模言語モデル (LLM) は人工知能のマイルストーンとして登場しており … 続きを読む

カテゴリー: cs.AI, cs.CL | Densing Law of LLMs はコメントを受け付けていません

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

要約 この論文では、非常に小さなデータセットに対して事前トレーニングされた大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL | The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation はコメントを受け付けていません

Retrieval-Augmented Machine Translation with Unstructured Knowledge

要約 検索拡張生成 (RAG) では、大規模言語モデル (LLM) を強化するた … 続きを読む

カテゴリー: cs.AI, cs.CL | Retrieval-Augmented Machine Translation with Unstructured Knowledge はコメントを受け付けていません

BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages

要約 この文書は、アッサム語、アワディー語、ベンガル語、ボージュプリ語、ブラジ語 … 続きを読む

カテゴリー: cs.AI, cs.CL | BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages はコメントを受け付けていません

CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels

要約 大規模言語モデル (LLM) は、多くの長いコンテキストのタスクでよく研究 … 続きを読む

カテゴリー: cs.AI, cs.CL | CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels はコメントを受け付けていません

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

要約 私たちは、オーバートレーニング設定における事前トレーニング済み言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL | Establishing Task Scaling Laws via Compute-Efficient Model Ladders はコメントを受け付けていません

WaveletGPT: Wavelets Meet Large Language Models

要約 大規模言語モデル (LLM) は、あらゆる科学分野と専門分野に影響を与える … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS, eess.SP | WaveletGPT: Wavelets Meet Large Language Models はコメントを受け付けていません

SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models

要約 事前トレーニングおよび命令の微調整段階での大規模言語モデル (LLM) の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models はコメントを受け付けていません

Moto: Latent Motion Token as the Bridging Language for Robot Manipulation

要約 広範なコーパスで事前トレーニングされた大規模言語モデルの最近の開発では、最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Moto: Latent Motion Token as the Bridging Language for Robot Manipulation はコメントを受け付けていません