月別アーカイブ: 2024年7月

On the Effect of Purely Synthetic Training Data for Different Automatic Speech Recognition Architectures

要約 この研究では、自動音声認識 (ASR) をトレーニングするための合成データ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | On the Effect of Purely Synthetic Training Data for Different Automatic Speech Recognition Architectures はコメントを受け付けていません

Keep the Cost Down: A Review on Methods to Optimize LLM’ s KV-Cache Consumption

要約 2022 年後半の ChatGPT リリースに代表される大規模言語モデル … 続きを読む

カテゴリー: cs.CL | Keep the Cost Down: A Review on Methods to Optimize LLM’ s KV-Cache Consumption はコメントを受け付けていません

GermanPartiesQA: Benchmarking Commercial Large Language Models for Political Bias and Sycophancy

要約 LLM は人間がコンテンツを作成し、操作する方法を変えており、国民の政治的 … 続きを読む

カテゴリー: cs.CL, cs.CY, K.4 | GermanPartiesQA: Benchmarking Commercial Large Language Models for Political Bias and Sycophancy はコメントを受け付けていません

Resolving Discrepancies in Compute-Optimal Scaling of Language Models

要約 カプランら。 およびホフマンら。 は、計算予算に応じて最適なモデル サイズ … 続きを読む

カテゴリー: cs.CL, cs.LG | Resolving Discrepancies in Compute-Optimal Scaling of Language Models はコメントを受け付けていません

PATCH! Psychometrics-AssisTed benCHmarking of Large Language Models: A Case Study of Proficiency in 8th Grade Mathematics

要約 大規模 (マルチモーダル) 言語モデル (LLM) の既存のベンチマークの … 続きを読む

カテゴリー: cs.CL, cs.CY | PATCH! Psychometrics-AssisTed benCHmarking of Large Language Models: A Case Study of Proficiency in 8th Grade Mathematics はコメントを受け付けていません

Improving Stance Detection by Leveraging Measurement Knowledge from Social Sciences: A Case Study of Dutch Political Tweets and Traditional Gender Role Division

要約 スタンス検出 (SD) は、ターゲットに対するテキストの作成者の視点 (つ … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.IR | Improving Stance Detection by Leveraging Measurement Knowledge from Social Sciences: A Case Study of Dutch Political Tweets and Traditional Gender Role Division はコメントを受け付けていません

I can listen but cannot read: An evaluation of two-tower multimodal systems for instrument recognition

要約 音楽 2 タワー マルチモーダル システムは、オーディオとテキストのモダリ … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG, cs.SD, eess.AS | I can listen but cannot read: An evaluation of two-tower multimodal systems for instrument recognition はコメントを受け付けていません

Tracking linguistic information in transformer-based sentence embeddings through targeted sparsification

要約 トランスフォーマーベースのモデルを分析したところ、テキスト入力からさまざま … 続きを読む

カテゴリー: 68T50, cs.CL, I.2.7 | Tracking linguistic information in transformer-based sentence embeddings through targeted sparsification はコメントを受け付けていません

The FIGNEWS Shared Task on News Media Narratives

要約 ACL 2024と同時開催されるArabicNLP 2024カンファレンス … 続きを読む

カテゴリー: cs.CL | The FIGNEWS Shared Task on News Media Narratives はコメントを受け付けていません

Block Verification Accelerates Speculative Decoding

要約 投機的デコードは、推論中に大規模な言語モデルをロスレスで高速化するための効 … 続きを読む

カテゴリー: cs.CL, cs.DS, cs.IT, cs.LG, math.IT | Block Verification Accelerates Speculative Decoding はコメントを受け付けていません