投稿者「jarxiv」のアーカイブ

None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks

要約 LLMの評価では、数学指向の質問に数値のバリエーションを実行することにより … 続きを読む

カテゴリー: cs.CL | None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks はコメントを受け付けていません

Comparative sentiment analysis of public perception: Monkeypox vs. COVID-19 behavioral insights

要約 Covid-19やMonkeypox(MPox)などの世界的な健康危機の出 … 続きを読む

カテゴリー: cs.CL, cs.LG | Comparative sentiment analysis of public perception: Monkeypox vs. COVID-19 behavioral insights はコメントを受け付けていません

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

要約 大規模な言語モデル(LLMS)の顕著な成果は、多くの人が知性の形を示すと結 … 続きを読む

カテゴリー: cs.CL, cs.LG | I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data? はコメントを受け付けていません

Matching Tasks with Industry Groups for Augmenting Commonsense Knowledge

要約 常識的な知識ベース(KB)は、機械学習アプリケーションを改善するために広く … 続きを読む

カテゴリー: cs.CL | Matching Tasks with Industry Groups for Augmenting Commonsense Knowledge はコメントを受け付けていません

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

要約 人工知能(AI)システムは、自律車両から生体認証まで、ますます重要なアプリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems はコメントを受け付けていません

A Survey on Collaborative Mechanisms Between Large and Small Language Models

要約 大規模な言語モデル(LLM)は強力なAI機能を提供しますが、リソースコスト … 続きを読む

カテゴリー: cs.AI, cs.CL | A Survey on Collaborative Mechanisms Between Large and Small Language Models はコメントを受け付けていません

Translating the Grievance Dictionary: a psychometric evaluation of Dutch, German, and Italian versions

要約 このペーパーでは、暴力的、脅迫的、または苦情処理されたテキストの分析のため … 続きを読む

カテゴリー: cs.CL | Translating the Grievance Dictionary: a psychometric evaluation of Dutch, German, and Italian versions はコメントを受け付けていません

ToolACE-DEV: Self-Improving Tool Learning via Decomposition and EVolution

要約 大規模な言語モデル(LLM)のツール使用機能により、最新の外部情報にアクセ … 続きを読む

カテゴリー: cs.AI, cs.CL | ToolACE-DEV: Self-Improving Tool Learning via Decomposition and EVolution はコメントを受け付けていません

Chain-of-Reasoning: Towards Unified Mathematical Reasoning in Large Language Models via a Multi-Paradigm Perspective

要約 大規模な言語モデル(LLM)は、数学的推論で顕著な進歩を遂げていますが、多 … 続きを読む

カテゴリー: cs.CL | Chain-of-Reasoning: Towards Unified Mathematical Reasoning in Large Language Models via a Multi-Paradigm Perspective はコメントを受け付けていません

SEReDeEP: Hallucination Detection in Retrieval-Augmented Models via Semantic Entropy and Context-Parameter Fusion

要約 検索された生成(RAG)モデルは、外部情報を内部のパラメトリック知識と統合 … 続きを読む

カテゴリー: cs.CL | SEReDeEP: Hallucination Detection in Retrieval-Augmented Models via Semantic Entropy and Context-Parameter Fusion はコメントを受け付けていません