「cs.CL」カテゴリーアーカイブ

Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts

投稿日: 2024年4月2日作成者: jarxiv

要約自然言語処理 (NLP) の分野は近年大幅な進歩を遂げており、革新的なプロ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

投稿日: 2024年4月2日作成者: jarxiv

要約人間の好みに合わせることで、高コストの人的フィードバックを必要とする一方で … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended)

投稿日: 2024年4月2日作成者: jarxiv

要約 Text-to-SQL は、自然言語を SQL (Structured Q … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DB | コメントを受け付けていません

X-LoRA: Mixture of Low-Rank Adapter Experts, a Flexible Framework for Large Language Models with Applications in Protein Mechanics and Molecular Design

投稿日: 2024年4月2日作成者: jarxiv

要約我々は、低ランク適応（LoRA）に基づく深い層ごとのトークンレベルのアプロ … 続きを読む →

カテゴリー: cond-mat.dis-nn, cond-mat.soft, cs.AI, cs.CL, cs.LG, q-bio.QM | コメントを受け付けていません

LangNav: Language as a Perceptual Representation for Navigation

投稿日: 2024年4月2日作成者: jarxiv

要約私たちは、低データ設定に焦点を当てて、視覚と言語のナビゲーション (VLN … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models

投稿日: 2024年4月2日作成者: jarxiv

要約論理的推論は人間にとって基本的なものですが、人工知能の分野では大きな課題と … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

DistillSpec: Improving Speculative Decoding via Knowledge Distillation

投稿日: 2024年4月2日作成者: jarxiv

要約投機的デコード (SD) は、複数のトークンを生成するためにより高速なドラ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue

投稿日: 2024年4月2日作成者: jarxiv

要約 ChatGPT などの大規模言語モデル (LLM) はますます洗練されてお … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

UrbanGPT: Spatio-Temporal Large Language Models

投稿日: 2024年4月2日作成者: jarxiv

要約時空間予測は、時間と空間の両方にわたって絶えず変化する都市環境のダイナミク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY | コメントを受け付けていません

Compressing Large Language Models by Streamlining the Unimportant Layer

投稿日: 2024年4月2日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまな自然言語タスクやドメインに広く … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts

Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended)

X-LoRA: Mixture of Low-Rank Adapter Experts, a Flexible Framework for Large Language Models with Applications in Protein Mechanics and Molecular Design

LangNav: Language as a Perceptual Representation for Navigation

Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models

DistillSpec: Improving Speculative Decoding via Knowledge Distillation

DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue

UrbanGPT: Spatio-Temporal Large Language Models

Compressing Large Language Models by Streamlining the Unimportant Layer

最近の投稿

最近のコメント

アーカイブ

カテゴリー