cs.CL」カテゴリーアーカイブ

A Gradient Analysis Framework for Rewarding Good and Penalizing Bad Examples in Language Models

要約 良い例の確率を最適化する言語モデル (LM) の標準目的である最尤推定 ( … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | A Gradient Analysis Framework for Rewarding Good and Penalizing Bad Examples in Language Models はコメントを受け付けていません

Reinforcement Learning without Human Feedback for Last Mile Fine-Tuning of Large Language Models

要約 強化学習は、尤度最大化を使用して大規模なコーパス内のテキストの次のトークン … 続きを読む

カテゴリー: cs.CL, cs.LG | Reinforcement Learning without Human Feedback for Last Mile Fine-Tuning of Large Language Models はコメントを受け付けていません

How Far Can Cantonese NLP Go? Benchmarking Cantonese Capabilities of Large Language Models

要約 大規模言語モデル (LLM) の急速な進化により、特に英語やその他のデータ … 続きを読む

カテゴリー: cs.CL | How Far Can Cantonese NLP Go? Benchmarking Cantonese Capabilities of Large Language Models はコメントを受け付けていません

Can LLMs perform structured graph reasoning?

要約 事前トレーニングされた大規模言語モデル (LLM) は、特に非構造化タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Can LLMs perform structured graph reasoning? はコメントを受け付けていません

Innovative Speech-Based Deep Learning Approaches for Parkinson’s Disease Classification: A Systematic Review

要約 パーキンソン病 (PD) は世界で 2 番目に蔓延している神経変性疾患であ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Innovative Speech-Based Deep Learning Approaches for Parkinson’s Disease Classification: A Systematic Review はコメントを受け付けていません

Adaptive Reinforcement Learning Planning: Harnessing Large Language Models for Complex Information Extraction

要約 大規模言語モデル (LLM) に関する既存の研究では、LLM が複数段階の … 続きを読む

カテゴリー: cs.AI, cs.CL | Adaptive Reinforcement Learning Planning: Harnessing Large Language Models for Complex Information Extraction はコメントを受け付けていません

Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies

要約 自然言語処理、特に GPT-4 のような大規模言語モデル (LLM) の最 … 続きを読む

カテゴリー: cs.AI, cs.CL | Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies はコメントを受け付けていません

Iterative Graph Alignment

要約 多様な物語を圧縮することで、LLM は暗記を超え、一般化可能な因果関係を捉 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MA | Iterative Graph Alignment はコメントを受け付けていません

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

要約 ColBERT などのマルチベクトル高密度モデルは、情報検索に非常に効果的 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.IR, I.2.7 | Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever はコメントを受け付けていません

GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM

要約 キー値 (KV) キャッシュは、大規模言語モデル (LLM) 推論の生成速 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM はコメントを受け付けていません