cs.AI」カテゴリーアーカイブ

Identifying and Addressing Delusions for Target-Directed Decision-Making

要約 私たちは、意思決定時の計画中に目標を生成し、行動を導き、評価中により良い一 … 続きを読む

カテゴリー: cs.AI | Identifying and Addressing Delusions for Target-Directed Decision-Making はコメントを受け付けていません

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

要約 大規模言語モデル (LLM) は、さまざまなタスクを実行しながら、多数の業 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining はコメントを受け付けていません

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy

要約 大規模言語モデル (LLM) ベースのエージェントがますます自律的になり、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.MA | I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy はコメントを受け付けていません

The FIX Benchmark: Extracting Features Interpretable to eXperts

要約 特徴ベースの手法は、モデルの予測を説明するためによく使用されますが、これら … 続きを読む

カテゴリー: cs.AI, cs.LG | The FIX Benchmark: Extracting Features Interpretable to eXperts はコメントを受け付けていません

ReFeR: Improving Evaluation and Reasoning through Hierarchy of Models

要約 大規模言語モデルやビジョン言語モデルなどの生成モデルによって生成される出力 … 続きを読む

カテゴリー: cs.AI, cs.CL | ReFeR: Improving Evaluation and Reasoning through Hierarchy of Models はコメントを受け付けていません

Mental Disorders Detection in the Era of Large Language Models

要約 この論文では、うつ病と不安を検出するタスクにおける、従来の機械学習手法、エ … 続きを読む

カテゴリー: cs.AI, cs.CL | Mental Disorders Detection in the Era of Large Language Models はコメントを受け付けていません

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

要約 AlpacaEval 2.0、Arena-Hard-Auto、MT-Ben … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates はコメントを受け付けていません

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

要約 トランスフォーマーベースの言語モデルに対するリカレント ニューラル ネット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling はコメントを受け付けていません

Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy

要約 メンタルヘルス療法には、患者と治療者が次に何を話すべきかを継続的に交渉する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy はコメントを受け付けていません

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

要約 近年、トレーニング データ アトリビューション (TDA) 手法が、ニュー … 続きを読む

カテゴリー: cs.AI, cs.LG | Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond はコメントを受け付けていません