「cs.CL」カテゴリーアーカイブ

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

投稿日: 2025年4月11日作成者: jarxiv

要約混合物（MOE）アーキテクチャは、タスク固有の専門家のまばらな活性化を伴う … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

投稿日: 2025年4月11日作成者: jarxiv

要約一般的な推論は、特定の事実の知識だけでなく、一般的な言語と世界の理解をカプ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

投稿日: 2025年4月11日作成者: jarxiv

要約風刺と偽のニュースは、どちらも異なる目的を持っているにもかかわらず、誤った … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Token Level Routing Inference System for Edge Devices

投稿日: 2025年4月11日作成者: jarxiv

要約大規模な言語モデル（LLM）推論の計算の複雑さは、エッジデバイスでの展開効 … 続きを読む →

カテゴリー: cs.CL, cs.DC | コメントを受け付けていません

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

投稿日: 2025年4月11日作成者: jarxiv

要約最近の研究では、大規模な言語モデル（LLM）が関連性を評価し、ドキュメント … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

Redefining Machine Translation on Social Network Services with Large Language Models

投稿日: 2025年4月11日作成者: jarxiv

要約社会的相互作用のグローバル化により、ソーシャルネットワークサービス（SNS … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

投稿日: 2025年4月11日作成者: jarxiv

要約複雑なタスクでの印象的なパフォーマンスにもかかわらず、現在の言語モデル（L … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments

投稿日: 2025年4月11日作成者: jarxiv

要約中小の生成言語モデルは、注目を集めています。それらのサイズと可用性により … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark

投稿日: 2025年4月11日作成者: jarxiv

要約このペーパーでは、ノルウェーの生成言語モデル（LMS）の大規模な標準化され … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

An Adversarial Perspective on Machine Unlearning for AI Safety

投稿日: 2025年4月11日作成者: jarxiv

要約大規模な言語モデルは、危険な知識に関する質問を拒否するために微調整されてい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

Token Level Routing Inference System for Edge Devices

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

Redefining Machine Translation on Social Network Services with Large Language Models

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments

NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark

An Adversarial Perspective on Machine Unlearning for AI Safety

最近の投稿

最近のコメント

アーカイブ

カテゴリー