cs.AI」カテゴリーアーカイブ

Evaluating ChatGPT as a Recommender System: A Rigorous Approach

要約 大規模言語モデル (LLM) は、最近、さまざまな自然言語関連タスクの処理 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Evaluating ChatGPT as a Recommender System: A Rigorous Approach はコメントを受け付けていません

CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models

要約 大規模言語モデル (LLM) の進歩により、命令に従って、目に見えないさま … 続きを読む

カテゴリー: cs.AI, cs.CL | CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models はコメントを受け付けていません

Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む

カテゴリー: 68T01, 68T50, 91B12, 91B14, cs.AI, cs.CL, cs.CY, cs.GT, cs.LG, I.2.0 | Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback はコメントを受け付けていません

Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks

要約 大規模言語モデル (LLM) が算術タスクを実行できる (およびできない) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks はコメントを受け付けていません

The complexity of approximate (coarse) correlated equilibrium for incomplete information games

要約 不完全情報ゲームにおける近似相関平衡の分散学習の反復の複雑さを研究します。 … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | The complexity of approximate (coarse) correlated equilibrium for incomplete information games はコメントを受け付けていません

Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models

要約 モデル編集の目的は、無関係な知識をそのまま残しながら、特定の知識に関連した … 続きを読む

カテゴリー: cs.AI, cs.CL | Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models はコメントを受け付けていません

Temporal Graph Rewiring with Expander Graphs

要約 現実世界のネットワークにおける進化する関係は、多くの場合、時間グラフによっ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SI, stat.ML | Temporal Graph Rewiring with Expander Graphs はコメントを受け付けていません

Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models

要約 拡散モデル (DM) は、非常に詳細で高品質の画像を生成します。 その力は … 続きを読む

カテゴリー: cs.AI, cs.LG | Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models はコメントを受け付けていません

NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism

要約 中国ジャーナリズムにおける編集能力の大規模言語モデル (LLM) の能力を … 続きを読む

カテゴリー: cs.AI, cs.CL | NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism はコメントを受け付けていません

An Empirical Analysis on Large Language Models in Debate Evaluation

要約 この研究では、議論の評価の文脈において、GPT-3.5 や GPT-4 な … 続きを読む

カテゴリー: cs.AI, cs.CL | An Empirical Analysis on Large Language Models in Debate Evaluation はコメントを受け付けていません