「cs.AI」カテゴリーアーカイブ

Evaluating ChatGPT as a Recommender System: A Rigorous Approach

投稿日: 2024年6月5日作成者: jarxiv

要約大規模言語モデル (LLM) は、最近、さまざまな自然言語関連タスクの処理 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models

投稿日: 2024年6月5日作成者: jarxiv

要約大規模言語モデル (LLM) の進歩により、命令に従って、目に見えないさま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

投稿日: 2024年6月5日作成者: jarxiv

要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む →

カテゴリー: 68T01, 68T50, 91B12, 91B14, cs.AI, cs.CL, cs.CY, cs.GT, cs.LG, I.2.0 | コメントを受け付けていません

Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks

投稿日: 2024年6月5日作成者: jarxiv

要約大規模言語モデル (LLM) が算術タスクを実行できる (およびできない) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The complexity of approximate (coarse) correlated equilibrium for incomplete information games

投稿日: 2024年6月5日作成者: jarxiv

要約不完全情報ゲームにおける近似相関平衡の分散学習の反復の複雑さを研究します。 … 続きを読む →

カテゴリー: cs.AI, cs.DS, cs.GT, cs.LG | コメントを受け付けていません

Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models

投稿日: 2024年6月5日作成者: jarxiv

要約モデル編集の目的は、無関係な知識をそのまま残しながら、特定の知識に関連した … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Temporal Graph Rewiring with Expander Graphs

投稿日: 2024年6月5日作成者: jarxiv

要約現実世界のネットワークにおける進化する関係は、多くの場合、時間グラフによっ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SI, stat.ML | コメントを受け付けていません

Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models

投稿日: 2024年6月5日作成者: jarxiv

要約拡散モデル (DM) は、非常に詳細で高品質の画像を生成します。その力は … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism

投稿日: 2024年6月5日作成者: jarxiv

要約中国ジャーナリズムにおける編集能力の大規模言語モデル (LLM) の能力を … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

An Empirical Analysis on Large Language Models in Debate Evaluation

投稿日: 2024年6月5日作成者: jarxiv

要約この研究では、議論の評価の文脈において、GPT-3.5 や GPT-4 な … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Evaluating ChatGPT as a Recommender System: A Rigorous Approach

CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models

Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks

The complexity of approximate (coarse) correlated equilibrium for incomplete information games

Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models

Temporal Graph Rewiring with Expander Graphs

Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models

NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism

An Empirical Analysis on Large Language Models in Debate Evaluation

最近の投稿

最近のコメント

アーカイブ

カテゴリー