月別アーカイブ: 2024年3月

Harder Tasks Need More Experts: Dynamic Routing in MoE Models

要約 この論文では、混合エキスパート (MoE) モデル用の新しい動的エキスパー … 続きを読む

カテゴリー: cs.CL, cs.LG | Harder Tasks Need More Experts: Dynamic Routing in MoE Models はコメントを受け付けていません

Understanding the Effects of Noise in Text-to-SQL: An Examination of the BIRD-Bench Benchmark

要約 自然言語を構造化照会言語 (SQL) に変換する Text-to-SQL … 続きを読む

カテゴリー: cs.CL | Understanding the Effects of Noise in Text-to-SQL: An Examination of the BIRD-Bench Benchmark はコメントを受け付けていません

MoralBERT: Detecting Moral Values in Social Discourse

要約 道徳は、私たちが情報をどのように認識するかにおいて基本的な役割を果たし、私 … 続きを読む

カテゴリー: cs.CL, cs.CY | MoralBERT: Detecting Moral Values in Social Discourse はコメントを受け付けていません

SATDAUG — A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt

要約 自己認めた技術的負債 (SATD) とは、コードベース内に技術的なショート … 続きを読む

カテゴリー: cs.CL, cs.SE | SATDAUG — A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt はコメントを受け付けていません

Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts

要約 Whisper は、99 言語をカバーするマルチタスクおよび多言語音声モデ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts はコメントを受け付けていません

StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models

要約 大規模言語モデル (LLM) は近年目覚ましい進歩を遂げており、LLM と … 続きを読む

カテゴリー: cs.CL | StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models はコメントを受け付けていません

SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes

要約 この論文では、幻覚の検出に焦点を当てた共有タスクである SHROOM の結 … 続きを読む

カテゴリー: cs.CL | SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes はコメントを受け付けていません

Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language Conversion for Language Models

要約 数列、分子式、表の区切り記号などの記号 (より広義には、非自然言語によるテ … 続きを読む

カテゴリー: cs.CL | Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language Conversion for Language Models はコメントを受け付けていません

Fine-tuning Large Language Models with Sequential Instructions

要約 大規模言語モデル (LLM) は、命令の一部を無視したり誤解したりする可能 … 続きを読む

カテゴリー: cs.CL | Fine-tuning Large Language Models with Sequential Instructions はコメントを受け付けていません

pyvene: A Library for Understanding and Improving PyTorch Models via Interventions

要約 モデルの内部状態への介入は、モデルの編集、ステアリング、ロバスト性、解釈可 … 続きを読む

カテゴリー: cs.CL, cs.LG | pyvene: A Library for Understanding and Improving PyTorch Models via Interventions はコメントを受け付けていません