cs.CL」カテゴリーアーカイブ

Variational Learning is Effective for Large Deep Networks

要約 変分学習は大規模なニューラル ネットワークには効果がないという一般的な考え … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, math.OC, stat.ML | Variational Learning is Effective for Large Deep Networks はコメントを受け付けていません

Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data

要約 定量的推論はデータを分析するための重要なスキルですが、そのような能力の評価 … 続きを読む

カテゴリー: cs.AI, cs.CL | Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data はコメントを受け付けていません

SongComposer: A Large Language Model for Lyric and Melody Composition in Song Generation

要約 私たちは、ソング作曲用に設計された革新的な LLM である SongCom … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | SongComposer: A Large Language Model for Lyric and Melody Composition in Song Generation はコメントを受け付けていません

Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts

要約 大規模言語モデル (LLM) に外部情報を提供することにより、ツール拡張 … 続きを読む

カテゴリー: cs.AI, cs.CL | Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts はコメントを受け付けていません

EvalLM: Interactive Evaluation of Large Language Model Prompts on User-Defined Criteria

要約 プロンプトを作成するだけで、開発者は大規模言語モデル (LLM) を使用し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | EvalLM: Interactive Evaluation of Large Language Model Prompts on User-Defined Criteria はコメントを受け付けていません

Case-Based or Rule-Based: How Do Transformers Do the Math?

要約 最新の大規模言語モデル (LLM) は、さまざまな複雑なタスクで優れたパフ … 続きを読む

カテゴリー: cs.AI, cs.CL | Case-Based or Rule-Based: How Do Transformers Do the Math? はコメントを受け付けていません

Evaluating Very Long-Term Conversational Memory of LLM Agents

要約 長期にわたるオープンドメインの対話に関する既存の研究は、5 つ以内のチャッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Evaluating Very Long-Term Conversational Memory of LLM Agents はコメントを受け付けていません

Preference Ranking Optimization for Human Alignment

要約 大規模言語モデル (LLM) には誤解を招くコンテンツが含まれることが多く … 続きを読む

カテゴリー: cs.AI, cs.CL | Preference Ranking Optimization for Human Alignment はコメントを受け付けていません

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

要約 何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web はコメントを受け付けていません

ID-XCB: Data-independent Debiasing for Fair and Accurate Transformer-based Cyberbullying Detection

要約 悪口は、ネットいじめ事件に関するデータセットを収集するための一般的な手段で … 続きを読む

カテゴリー: cs.CL | ID-XCB: Data-independent Debiasing for Fair and Accurate Transformer-based Cyberbullying Detection はコメントを受け付けていません