cs.CL」カテゴリーアーカイブ

Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models

要約 リカレント ニューラル ネットワーク (RNN) は推論が速く、長いシーケ … 続きを読む

カテゴリー: cs.CL, cs.LG | Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models はコメントを受け付けていません

Redefining Digital Health Interfaces with Large Language Models

要約 デジタル医療ツールは、医療サービスの提供を大幅に改善する可能性を秘めていま … 続きを読む

カテゴリー: cs.CL | Redefining Digital Health Interfaces with Large Language Models はコメントを受け付けていません

Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models

要約 Adam は、大規模な言語トランスフォーマーの最適化において勾配降下法を上 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC, stat.ML | Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models はコメントを受け付けていません

Sequoia: Scalable, Robust, and Hardware-aware Speculative Decoding

要約 大規模言語モデル (LLM) の使用が増えるにつれて、これらのモデルを使用 … 続きを読む

カテゴリー: cs.CL | Sequoia: Scalable, Robust, and Hardware-aware Speculative Decoding はコメントを受け付けていません

Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing

要約 文献からポリマー太陽電池の特性データを抽出し、さまざまなアクティブ ラーニ … 続きを読む

カテゴリー: cond-mat.mtrl-sci, cs.CL, physics.app-ph | Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing はコメントを受け付けていません

Robust Guidance for Unsupervised Data Selection: Capturing Perplexing Named Entities for Domain-Specific Machine Translation

要約 広範なデータセットを使用することで、多言語機械翻訳モデルのトレーニングが可 … 続きを読む

カテゴリー: cs.AI, cs.CL | Robust Guidance for Unsupervised Data Selection: Capturing Perplexing Named Entities for Domain-Specific Machine Translation はコメントを受け付けていません

‘It Felt Like Having a Second Mind’: Investigating Human-AI Co-creativity in Prewriting with Large Language Models

要約 プリライティングは、最初の草稿の前にアイデアを発見して発展させるプロセスで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | ‘It Felt Like Having a Second Mind’: Investigating Human-AI Co-creativity in Prewriting with Large Language Models はコメントを受け付けていません

LLM Inference Unveiled: Survey and Roofline Model Insights

要約 効率的な大規模言語モデル (LLM) 推論の分野は急速に進化しており、機会 … 続きを読む

カテゴリー: cs.AI, cs.CL | LLM Inference Unveiled: Survey and Roofline Model Insights はコメントを受け付けていません

OpenMedLM: Prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models

要約 LLM は、さまざまな特殊なタスクを実行できる能力がますます高まっており、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | OpenMedLM: Prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models はコメントを受け付けていません

Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Match Human Crowd Accuracy

要約 実際の人間の予測精度は「群衆の知恵」効果に依存しており、個々の予測者の群衆 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Match Human Crowd Accuracy はコメントを受け付けていません