月別アーカイブ: 2024年3月

Harder Tasks Need More Experts: Dynamic Routing in MoE Models

投稿日: 2024年3月13日作成者: jarxiv

要約この論文では、混合エキスパート (MoE) モデル用の新しい動的エキスパー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Understanding the Effects of Noise in Text-to-SQL: An Examination of the BIRD-Bench Benchmark

投稿日: 2024年3月13日作成者: jarxiv

要約自然言語を構造化照会言語 (SQL) に変換する Text-to-SQL … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MoralBERT: Detecting Moral Values in Social Discourse

投稿日: 2024年3月13日作成者: jarxiv

要約道徳は、私たちが情報をどのように認識するかにおいて基本的な役割を果たし、私 … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

SATDAUG — A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt

投稿日: 2024年3月13日作成者: jarxiv

要約自己認めた技術的負債 (SATD) とは、コードベース内に技術的なショート … 続きを読む →

カテゴリー: cs.CL, cs.SE | コメントを受け付けていません

Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts

投稿日: 2024年3月13日作成者: jarxiv

要約 Whisper は、99 言語をカバーするマルチタスクおよび多言語音声モデ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models

投稿日: 2024年3月13日作成者: jarxiv

要約大規模言語モデル (LLM) は近年目覚ましい進歩を遂げており、LLM と … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes

投稿日: 2024年3月13日作成者: jarxiv

要約この論文では、幻覚の検出に焦点を当てた共有タスクである SHROOM の結 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language Conversion for Language Models

投稿日: 2024年3月13日作成者: jarxiv

要約数列、分子式、表の区切り記号などの記号 (より広義には、非自然言語によるテ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Fine-tuning Large Language Models with Sequential Instructions

投稿日: 2024年3月13日作成者: jarxiv

要約大規模言語モデル (LLM) は、命令の一部を無視したり誤解したりする可能 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

pyvene: A Library for Understanding and Improving PyTorch Models via Interventions

投稿日: 2024年3月13日作成者: jarxiv

要約モデルの内部状態への介入は、モデルの編集、ステアリング、ロバスト性、解釈可 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年3月

Harder Tasks Need More Experts: Dynamic Routing in MoE Models

Understanding the Effects of Noise in Text-to-SQL: An Examination of the BIRD-Bench Benchmark

MoralBERT: Detecting Moral Values in Social Discourse

SATDAUG — A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt

Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts

StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models

SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes

Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language Conversion for Language Models

Fine-tuning Large Language Models with Sequential Instructions

pyvene: A Library for Understanding and Improving PyTorch Models via Interventions

最近の投稿

最近のコメント

アーカイブ

カテゴリー