月別アーカイブ: 2024年5月

Feature-based Low-Rank Compression of Large Language Models via Bayesian Optimization

要約 近年、大規模言語モデル (LLM) によって自然言語処理の進歩が推進されて … 続きを読む

カテゴリー: cs.CL, cs.LG | Feature-based Low-Rank Compression of Large Language Models via Bayesian Optimization はコメントを受け付けていません

Specialising and Analysing Instruction-Tuned and Byte-Level Language Models for Organic Reaction Prediction

要約 トランスフォーマーベースのエンコーダー/デコーダー モデルは、化学反応予測 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, q-bio.BM | Specialising and Analysing Instruction-Tuned and Byte-Level Language Models for Organic Reaction Prediction はコメントを受け付けていません

Dynamic data sampler for cross-language transfer learning in large language models

要約 大規模言語モデル (LLM) は、その応用範囲が広いため、自然言語処理 ( … 続きを読む

カテゴリー: cs.CL | Dynamic data sampler for cross-language transfer learning in large language models はコメントを受け付けていません

DeepPavlov at SemEval-2024 Task 8: Leveraging Transfer Learning for Detecting Boundaries of Machine-Generated Texts

要約 SemEval-2024 コンペティションのマルチジェネレーター、マルチド … 続きを読む

カテゴリー: cs.AI, cs.CL | DeepPavlov at SemEval-2024 Task 8: Leveraging Transfer Learning for Detecting Boundaries of Machine-Generated Texts はコメントを受け付けていません

Medical Dialogue: A Survey of Categories, Methods, Evaluation and Challenges

要約 本稿では、重要かつ困難な課題である医療対話システムに関する研究成果を調査し … 続きを読む

カテゴリー: cs.AI, cs.CL | Medical Dialogue: A Survey of Categories, Methods, Evaluation and Challenges はコメントを受け付けていません

Layer-Condensed KV Cache for Efficient Inference of Large Language Models

要約 大量のメモリ消費は、現実世界のアプリケーションに高スループットの大規模言語 … 続きを読む

カテゴリー: cs.CL | Layer-Condensed KV Cache for Efficient Inference of Large Language Models はコメントを受け付けていません

SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation

要約 構成的一般化は言語モデルの重要な能力であり、さまざまな症状が現れます。 デ … 続きを読む

カテゴリー: cs.CL | SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation はコメントを受け付けていません

Revolutionizing Process Mining: A Novel Architecture for ChatGPT Integration and Enhanced User Experience through Optimized Prompt Engineering

要約 急速に進化するビジネス プロセス管理の分野では、複雑なデータを実用的な洞察 … 続きを読む

カテゴリー: cs.CL | Revolutionizing Process Mining: A Novel Architecture for ChatGPT Integration and Enhanced User Experience through Optimized Prompt Engineering はコメントを受け付けていません

INDUS: Effective and Efficient Language Models for Scientific Applications

要約 一般的なドメイン コーパスでトレーニングされた大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.IR | INDUS: Effective and Efficient Language Models for Scientific Applications はコメントを受け付けていません

Feature-Adaptive and Data-Scalable In-Context Learning

要約 いくつかのデモンストレーションを使用して推論を促進するインコンテキスト学習 … 続きを読む

カテゴリー: cs.CL | Feature-Adaptive and Data-Scalable In-Context Learning はコメントを受け付けていません