cs.CL」カテゴリーアーカイブ

Towards Building Multilingual Language Model for Medicine

要約 この論文では、さまざまな地域のより広範で言語的に多様な聴衆に利益をもたらす … 続きを読む

カテゴリー: cs.CL | Towards Building Multilingual Language Model for Medicine はコメントを受け付けていません

Are You Sure? Challenging LLMs Leads to Performance Drops in The FlipFlop Experiment

要約 大規模言語モデル (LLM) のインタラクティブな性質により、理論的にはモ … 続きを読む

カテゴリー: cs.CL | Are You Sure? Challenging LLMs Leads to Performance Drops in The FlipFlop Experiment はコメントを受け付けていません

Analysing The Impact of Sequence Composition on Language Model Pre-Training

要約 ほとんどの言語モデルの事前トレーニング フレームワークは、複数のドキュメン … 続きを読む

カテゴリー: cs.CL | Analysing The Impact of Sequence Composition on Language Model Pre-Training はコメントを受け付けていません

Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

要約 トランスフォーマー アーキテクチャを備えた大規模言語モデルは、テキスト生成 … 続きを読む

カテゴリー: cs.CL | Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models はコメントを受け付けていません

OlympiadBench: A Challenging Benchmark for Promoting AGI with Olympiad-Level Bilingual Multimodal Scientific Problems

要約 最近の進歩により、大規模言語モデル (LLM) と大規模マルチモーダル モ … 続きを読む

カテゴリー: cs.CL | OlympiadBench: A Challenging Benchmark for Promoting AGI with Olympiad-Level Bilingual Multimodal Scientific Problems はコメントを受け付けていません

Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment

要約 大規模言語モデル (LLM) は強力なゼロショット評価ツールであり、筆記試 … 続きを読む

カテゴリー: cs.CL | Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment はコメントを受け付けていません

Coercing LLMs to do and reveal (almost) anything

要約 最近、大規模言語モデル (LLM) に対する敵対的攻撃により、モデルが「脱 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Coercing LLMs to do and reveal (almost) anything はコメントを受け付けていません

CriticBench: Evaluating Large Language Models as Critic

要約 大規模言語モデル (LLM) のスケーラブルな監視と自己改善には、批判能力 … 続きを読む

カテゴリー: cs.AI, cs.CL | CriticBench: Evaluating Large Language Models as Critic はコメントを受け付けていません

CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing

要約 大規模言語モデル (LLM) の最近の発展は目覚ましいものがあります。 た … 続きを読む

カテゴリー: cs.AI, cs.CL | CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing はコメントを受け付けていません

ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving

要約 大規模な言語モデルは、さまざまな言語タスクにおいて大幅な進歩を遂げています … 続きを読む

カテゴリー: cs.AI, cs.CL | ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving はコメントを受け付けていません