月別アーカイブ: 2025年4月

Expressivity and Speech Synthesis

要約 話をする能力を機械に吹き込むことは、人工知能(AI)の研究の長年の追求でし … 続きを読む

カテゴリー: cs.CL | Expressivity and Speech Synthesis はコメントを受け付けていません

ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering

要約 チャートは遍在しています。多くの場合、人々はそれらを使用してデータを分析し … 続きを読む

カテゴリー: cs.CL | ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering はコメントを受け付けていません

Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation

要約 このホワイトペーパーでは、多様で包括的な回答を生成する際の(検索)大規模な … 続きを読む

カテゴリー: cs.CL, cs.IR | Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation はコメントを受け付けていません

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

要約 混合物(MOE)アーキテクチャは、タスク固有の専門家のまばらな活性化を伴う … 続きを読む

カテゴリー: cs.CL | Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models はコメントを受け付けていません

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

要約 一般的な推論は、特定の事実の知識だけでなく、一般的な言語と世界の理解をカプ … 続きを読む

カテゴリー: cs.CL | What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks はコメントを受け付けていません

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

要約 風刺と偽のニュースは、どちらも異なる目的を持っているにもかかわらず、誤った … 続きを読む

カテゴリー: cs.CL | MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles はコメントを受け付けていません

Token Level Routing Inference System for Edge Devices

要約 大規模な言語モデル(LLM)推論の計算の複雑さは、エッジデバイスでの展開効 … 続きを読む

カテゴリー: cs.CL, cs.DC | Token Level Routing Inference System for Edge Devices はコメントを受け付けていません

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

要約 最近の研究では、大規模な言語モデル(LLM)が関連性を評価し、ドキュメント … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective はコメントを受け付けていません

Redefining Machine Translation on Social Network Services with Large Language Models

要約 社会的相互作用のグローバル化により、ソーシャルネットワークサービス(SNS … 続きを読む

カテゴリー: cs.CL | Redefining Machine Translation on Social Network Services with Large Language Models はコメントを受け付けていません

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

要約 複雑なタスクでの印象的なパフォーマンスにもかかわらず、現在の言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory はコメントを受け付けていません