月別アーカイブ: 2024年2月

Are You Sure? Challenging LLMs Leads to Performance Drops in The FlipFlop Experiment

要約 大規模言語モデル (LLM) のインタラクティブな性質により、理論的にはモ … 続きを読む

カテゴリー: cs.CL | Are You Sure? Challenging LLMs Leads to Performance Drops in The FlipFlop Experiment はコメントを受け付けていません

Analysing The Impact of Sequence Composition on Language Model Pre-Training

要約 ほとんどの言語モデルの事前トレーニング フレームワークは、複数のドキュメン … 続きを読む

カテゴリー: cs.CL | Analysing The Impact of Sequence Composition on Language Model Pre-Training はコメントを受け付けていません

Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

要約 トランスフォーマー アーキテクチャを備えた大規模言語モデルは、テキスト生成 … 続きを読む

カテゴリー: cs.CL | Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models はコメントを受け付けていません

OlympiadBench: A Challenging Benchmark for Promoting AGI with Olympiad-Level Bilingual Multimodal Scientific Problems

要約 最近の進歩により、大規模言語モデル (LLM) と大規模マルチモーダル モ … 続きを読む

カテゴリー: cs.CL | OlympiadBench: A Challenging Benchmark for Promoting AGI with Olympiad-Level Bilingual Multimodal Scientific Problems はコメントを受け付けていません

Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment

要約 大規模言語モデル (LLM) は強力なゼロショット評価ツールであり、筆記試 … 続きを読む

カテゴリー: cs.CL | Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment はコメントを受け付けていません

Coercing LLMs to do and reveal (almost) anything

要約 最近、大規模言語モデル (LLM) に対する敵対的攻撃により、モデルが「脱 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Coercing LLMs to do and reveal (almost) anything はコメントを受け付けていません

AI-Powered Predictions for Electricity Load in Prosumer Communities

要約 再生可能エネルギー源やエネルギー貯蔵施設(別名プロシューマー)を含む住宅の … 続きを読む

カテゴリー: cs.AI, cs.LG | AI-Powered Predictions for Electricity Load in Prosumer Communities はコメントを受け付けていません

Reinforcement learning-assisted quantum architecture search for variational quantum algorithms

要約 ノイズの多い中規模量子 (NISQ) 時代の大きなハードルは、機能する量子 … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | Reinforcement learning-assisted quantum architecture search for variational quantum algorithms はコメントを受け付けていません

CriticBench: Evaluating Large Language Models as Critic

要約 大規模言語モデル (LLM) のスケーラブルな監視と自己改善には、批判能力 … 続きを読む

カテゴリー: cs.AI, cs.CL | CriticBench: Evaluating Large Language Models as Critic はコメントを受け付けていません

Deep Generative Models for Offline Policy Learning: Tutorial, Survey, and Perspectives on Future Directions

要約 ディープ生成モデル (DGM) は、特にオフライン データからトレーニング … 続きを読む

カテゴリー: cs.AI, cs.LG | Deep Generative Models for Offline Policy Learning: Tutorial, Survey, and Perspectives on Future Directions はコメントを受け付けていません