「cs.CL」カテゴリーアーカイブ

CoSy: Evaluating Textual Explanations of Neurons

投稿日: 2024年12月6日作成者: jarxiv

要約ディープニューラルネットワーク (DNN) の複雑な性質を理解する上で … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Densing Law of LLMs

投稿日: 2024年12月6日作成者: jarxiv

要約大規模言語モデル (LLM) は人工知能のマイルストーンとして登場しており … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

投稿日: 2024年12月6日作成者: jarxiv

要約この論文では、非常に小さなデータセットに対して事前トレーニングされた大規模 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Retrieval-Augmented Machine Translation with Unstructured Knowledge

投稿日: 2024年12月6日作成者: jarxiv

要約検索拡張生成 (RAG) では、大規模言語モデル (LLM) を強化するた … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages

投稿日: 2024年12月6日作成者: jarxiv

要約この文書は、アッサム語、アワディー語、ベンガル語、ボージュプリ語、ブラジ語 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels

投稿日: 2024年12月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、多くの長いコンテキストのタスクでよく研究 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

投稿日: 2024年12月6日作成者: jarxiv

要約私たちは、オーバートレーニング設定における事前トレーニング済み言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

WaveletGPT: Wavelets Meet Large Language Models

投稿日: 2024年12月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、あらゆる科学分野と専門分野に影響を与える … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS, eess.SP | コメントを受け付けていません

SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models

投稿日: 2024年12月6日作成者: jarxiv

要約事前トレーニングおよび命令の微調整段階での大規模言語モデル (LLM) の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Moto: Latent Motion Token as the Bridging Language for Robot Manipulation

投稿日: 2024年12月6日作成者: jarxiv

要約広範なコーパスで事前トレーニングされた大規模言語モデルの最近の開発では、最 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

CoSy: Evaluating Textual Explanations of Neurons

Densing Law of LLMs

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

Retrieval-Augmented Machine Translation with Unstructured Knowledge

BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages

CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

WaveletGPT: Wavelets Meet Large Language Models

SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models

Moto: Latent Motion Token as the Bridging Language for Robot Manipulation

最近の投稿

最近のコメント

アーカイブ

カテゴリー