cs.LG」カテゴリーアーカイブ

MYTE: Morphology-Driven Byte Encoding for Better and Fairer Multilingual Language Modeling

要約 多言語言語モデリングにおける主な考慮事項は、多様な語彙と文字を持つ言語を最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MYTE: Morphology-Driven Byte Encoding for Better and Fairer Multilingual Language Modeling はコメントを受け付けていません

Data Diversity Matters for Robust Instruction Tuning

要約 最近の研究では、高品質で多様な命令調整データセットを厳選することで、命令追 … 続きを読む

カテゴリー: cs.CL, cs.LG | Data Diversity Matters for Robust Instruction Tuning はコメントを受け付けていません

Aligning LLMs for FL-free Program Repair

要約 大規模言語モデル (LLM) は、自動プログラム修復 (APR) でまとも … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | Aligning LLMs for FL-free Program Repair はコメントを受け付けていません

Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study

要約 固有表現認識は、現実世界のオブジェクトに名前を付けるテキスト内の部分文字列 … 続きを読む

カテゴリー: 68Q32, 68T50, cs.CL, cs.LG | Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study はコメントを受け付けていません

Training Neural Networks as Recognizers of Formal Languages

要約 形式言語理論の観点からニューラル ネットワーク アーキテクチャの計算能力を … 続きを読む

カテゴリー: cs.CL, cs.LG | Training Neural Networks as Recognizers of Formal Languages はコメントを受け付けていません

Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding

要約 自然言語理解のための最近のモデルは、一般にショートカットとして知られるデー … 続きを読む

カテゴリー: cs.CL, cs.LG | Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding はコメントを受け付けていません

Benchmarking LLMs’ Judgments with No Gold Standard

要約 大規模言語モデル (LLM) による言語生成を評価するための評価指標である … 続きを読む

カテゴリー: cs.CL, cs.LG | Benchmarking LLMs’ Judgments with No Gold Standard はコメントを受け付けていません

Stronger Random Baselines for In-Context Learning

要約 言語モデルのコンテキスト内学習分類のパフォーマンスを評価する場合、データセ … 続きを読む

カテゴリー: cs.CL, cs.LG | Stronger Random Baselines for In-Context Learning はコメントを受け付けていません

E3x: $\mathrm{E}(3)$-Equivariant Deep Learning Made Easy

要約 この研究では、3 次元空間の平行移動、回転、反射で構成されるユークリッド群 … 続きを読む

カテゴリー: cs.AI, cs.LG, physics.chem-ph | E3x: $\mathrm{E}(3)$-Equivariant Deep Learning Made Easy はコメントを受け付けていません

Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training

要約 ネットワーク プルーニングは、パフォーマンスへの影響を最小限に抑えながらパ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training はコメントを受け付けていません