「cs.AI」カテゴリーアーカイブ

Identifying and Addressing Delusions for Target-Directed Decision-Making

投稿日: 2024年10月10日作成者: jarxiv

要約私たちは、意思決定時の計画中に目標を生成し、行動を導き、評価中により良い一 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなタスクを実行しながら、多数の業 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデル (LLM) ベースのエージェントがますます自律的になり、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.MA | コメントを受け付けていません

The FIX Benchmark: Extracting Features Interpretable to eXperts

投稿日: 2024年10月10日作成者: jarxiv

要約特徴ベースの手法は、モデルの予測を説明するためによく使用されますが、これら … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

ReFeR: Improving Evaluation and Reasoning through Hierarchy of Models

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデルやビジョン言語モデルなどの生成モデルによって生成される出力 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Mental Disorders Detection in the Era of Large Language Models

投稿日: 2024年10月10日作成者: jarxiv

要約この論文では、うつ病と不安を検出するタスクにおける、従来の機械学習手法、エ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

投稿日: 2024年10月10日作成者: jarxiv

要約 AlpacaEval 2.0、Arena-Hard-Auto、MT-Ben … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

投稿日: 2024年10月10日作成者: jarxiv

要約トランスフォーマーベースの言語モデルに対するリカレントニューラルネット … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy

投稿日: 2024年10月10日作成者: jarxiv

要約メンタルヘルス療法には、患者と治療者が次に何を話すべきかを継続的に交渉する … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY | コメントを受け付けていません

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

投稿日: 2024年10月10日作成者: jarxiv

要約近年、トレーニングデータアトリビューション (TDA) 手法が、ニュー … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Identifying and Addressing Delusions for Target-Directed Decision-Making

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy

The FIX Benchmark: Extracting Features Interpretable to eXperts

ReFeR: Improving Evaluation and Reasoning through Hierarchy of Models

Mental Disorders Detection in the Era of Large Language Models

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

最近の投稿

最近のコメント

アーカイブ

カテゴリー