月別アーカイブ: 2025年4月

Expressivity and Speech Synthesis

投稿日: 2025年4月11日作成者: jarxiv

要約話をする能力を機械に吹き込むことは、人工知能（AI）の研究の長年の追求でし … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering

投稿日: 2025年4月11日作成者: jarxiv

要約チャートは遍在しています。多くの場合、人々はそれらを使用してデータを分析し … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation

投稿日: 2025年4月11日作成者: jarxiv

要約このホワイトペーパーでは、多様で包括的な回答を生成する際の（検索）大規模な … 続きを読む →

カテゴリー: cs.CL, cs.IR | コメントを受け付けていません

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

投稿日: 2025年4月11日作成者: jarxiv

要約混合物（MOE）アーキテクチャは、タスク固有の専門家のまばらな活性化を伴う … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

投稿日: 2025年4月11日作成者: jarxiv

要約一般的な推論は、特定の事実の知識だけでなく、一般的な言語と世界の理解をカプ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

投稿日: 2025年4月11日作成者: jarxiv

要約風刺と偽のニュースは、どちらも異なる目的を持っているにもかかわらず、誤った … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Token Level Routing Inference System for Edge Devices

投稿日: 2025年4月11日作成者: jarxiv

要約大規模な言語モデル（LLM）推論の計算の複雑さは、エッジデバイスでの展開効 … 続きを読む →

カテゴリー: cs.CL, cs.DC | コメントを受け付けていません

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

投稿日: 2025年4月11日作成者: jarxiv

要約最近の研究では、大規模な言語モデル（LLM）が関連性を評価し、ドキュメント … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

Redefining Machine Translation on Social Network Services with Large Language Models

投稿日: 2025年4月11日作成者: jarxiv

要約社会的相互作用のグローバル化により、ソーシャルネットワークサービス（SNS … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

投稿日: 2025年4月11日作成者: jarxiv

要約複雑なタスクでの印象的なパフォーマンスにもかかわらず、現在の言語モデル（L … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年4月

Expressivity and Speech Synthesis

ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering

Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks

MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles

Token Level Routing Inference System for Edge Devices

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

Redefining Machine Translation on Social Network Services with Large Language Models

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

最近の投稿

最近のコメント

アーカイブ

カテゴリー