「cs.LG」カテゴリーアーカイブ

MYTE: Morphology-Driven Byte Encoding for Better and Fairer Multilingual Language Modeling

投稿日: 2024年11月12日作成者: jarxiv

要約多言語言語モデリングにおける主な考慮事項は、多様な語彙と文字を持つ言語を最 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Data Diversity Matters for Robust Instruction Tuning

投稿日: 2024年11月12日作成者: jarxiv

要約最近の研究では、高品質で多様な命令調整データセットを厳選することで、命令追 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Aligning LLMs for FL-free Program Repair

投稿日: 2024年11月12日作成者: jarxiv

要約大規模言語モデル (LLM) は、自動プログラム修復 (APR) でまとも … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SE | コメントを受け付けていません

Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study

投稿日: 2024年11月12日作成者: jarxiv

要約固有表現認識は、現実世界のオブジェクトに名前を付けるテキスト内の部分文字列 … 続きを読む →

カテゴリー: 68Q32, 68T50, cs.CL, cs.LG | コメントを受け付けていません

Training Neural Networks as Recognizers of Formal Languages

投稿日: 2024年11月12日作成者: jarxiv

要約形式言語理論の観点からニューラルネットワークアーキテクチャの計算能力を … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding

投稿日: 2024年11月12日作成者: jarxiv

要約自然言語理解のための最近のモデルは、一般にショートカットとして知られるデー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Benchmarking LLMs’ Judgments with No Gold Standard

投稿日: 2024年11月12日作成者: jarxiv

要約大規模言語モデル (LLM) による言語生成を評価するための評価指標である … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Stronger Random Baselines for In-Context Learning

投稿日: 2024年11月12日作成者: jarxiv

要約言語モデルのコンテキスト内学習分類のパフォーマンスを評価する場合、データセ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

E3x: $\mathrm{E}(3)$-Equivariant Deep Learning Made Easy

投稿日: 2024年11月12日作成者: jarxiv

要約この研究では、3 次元空間の平行移動、回転、反射で構成されるユークリッド群 … 続きを読む →

カテゴリー: cs.AI, cs.LG, physics.chem-ph | コメントを受け付けていません

Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training

投稿日: 2024年11月12日作成者: jarxiv

要約ネットワークプルーニングは、パフォーマンスへの影響を最小限に抑えながらパ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

MYTE: Morphology-Driven Byte Encoding for Better and Fairer Multilingual Language Modeling

Data Diversity Matters for Robust Instruction Tuning

Aligning LLMs for FL-free Program Repair

Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study

Training Neural Networks as Recognizers of Formal Languages

Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding

Benchmarking LLMs’ Judgments with No Gold Standard

Stronger Random Baselines for In-Context Learning

E3x: $\mathrm{E}(3)$-Equivariant Deep Learning Made Easy

Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training

最近の投稿

最近のコメント

アーカイブ

カテゴリー