cs.CL」カテゴリーアーカイブ

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

要約 混合物(MOE)アーキテクチャは、タスク固有の専門家のまばらな活性化を伴う … 続きを読む

カテゴリー: cs.CL | Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models はコメントを受け付けていません

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

要約 一般的な推論は、特定の事実の知識だけでなく、一般的な言語と世界の理解をカプ … 続きを読む

カテゴリー: cs.CL | What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks はコメントを受け付けていません

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

要約 風刺と偽のニュースは、どちらも異なる目的を持っているにもかかわらず、誤った … 続きを読む

カテゴリー: cs.CL | MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles はコメントを受け付けていません

Token Level Routing Inference System for Edge Devices

要約 大規模な言語モデル(LLM)推論の計算の複雑さは、エッジデバイスでの展開効 … 続きを読む

カテゴリー: cs.CL, cs.DC | Token Level Routing Inference System for Edge Devices はコメントを受け付けていません

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

要約 最近の研究では、大規模な言語モデル(LLM)が関連性を評価し、ドキュメント … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective はコメントを受け付けていません

Redefining Machine Translation on Social Network Services with Large Language Models

要約 社会的相互作用のグローバル化により、ソーシャルネットワークサービス(SNS … 続きを読む

カテゴリー: cs.CL | Redefining Machine Translation on Social Network Services with Large Language Models はコメントを受け付けていません

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

要約 複雑なタスクでの印象的なパフォーマンスにもかかわらず、現在の言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory はコメントを受け付けていません

Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments

要約 中小の生成言語モデルは、注目を集めています。 それらのサイズと可用性により … 続きを読む

カテゴリー: cs.CL, cs.LG | Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments はコメントを受け付けていません

NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark

要約 このペーパーでは、ノルウェーの生成言語モデル(LMS)の大規模な標準化され … 続きを読む

カテゴリー: cs.AI, cs.CL | NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark はコメントを受け付けていません

An Adversarial Perspective on Machine Unlearning for AI Safety

要約 大規模な言語モデルは、危険な知識に関する質問を拒否するために微調整されてい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | An Adversarial Perspective on Machine Unlearning for AI Safety はコメントを受け付けていません