cs.CL」カテゴリーアーカイブ

Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts

要約 自然言語処理 (NLP) の分野は近年大幅な進歩を遂げており、革新的なプロ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts はコメントを受け付けていません

Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

要約 人間の好みに合わせることで、高コストの人的フィードバックを必要とする一方で … 続きを読む

カテゴリー: cs.AI, cs.CL | Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment はコメントを受け付けていません

SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended)

要約 Text-to-SQL は、自然言語を SQL (Structured Q … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) はコメントを受け付けていません

X-LoRA: Mixture of Low-Rank Adapter Experts, a Flexible Framework for Large Language Models with Applications in Protein Mechanics and Molecular Design

要約 我々は、低ランク適応(LoRA)に基づく深い層ごとのトークンレベルのアプロ … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.soft, cs.AI, cs.CL, cs.LG, q-bio.QM | X-LoRA: Mixture of Low-Rank Adapter Experts, a Flexible Framework for Large Language Models with Applications in Protein Mechanics and Molecular Design はコメントを受け付けていません

LangNav: Language as a Perceptual Representation for Navigation

要約 私たちは、低データ設定に焦点を当てて、視覚と言語のナビゲーション (VLN … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | LangNav: Language as a Perceptual Representation for Navigation はコメントを受け付けていません

Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models

要約 論理的推論は人間にとって基本的なものですが、人工知能の分野では大きな課題と … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models はコメントを受け付けていません

DistillSpec: Improving Speculative Decoding via Knowledge Distillation

要約 投機的デコード (SD) は、複数のトークンを生成するためにより高速なドラ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DistillSpec: Improving Speculative Decoding via Knowledge Distillation はコメントを受け付けていません

DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue

要約 ChatGPT などの大規模言語モデル (LLM) はますます洗練されてお … 続きを読む

カテゴリー: cs.AI, cs.CL | DiagGPT: An LLM-based Chatbot with Automatic Topic Management for Task-Oriented Dialogue はコメントを受け付けていません

UrbanGPT: Spatio-Temporal Large Language Models

要約 時空間予測は、時間と空間の両方にわたって絶えず変化する都市環境のダイナミク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | UrbanGPT: Spatio-Temporal Large Language Models はコメントを受け付けていません

Compressing Large Language Models by Streamlining the Unimportant Layer

要約 大規模言語モデル (LLM) は、さまざまな自然言語タスクやドメインに広く … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Compressing Large Language Models by Streamlining the Unimportant Layer はコメントを受け付けていません