cs.CL」カテゴリーアーカイブ

REAL: Response Embedding-based Alignment for LLMs

要約 大規模な言語モデル(LLM)を人間の好みに合わせることは、通常、監視された … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation

要約 医学の大規模な言語モデル(LLM)を評価することは重要です。なぜなら、医療 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

EuroLLM-9B: Technical Report

要約 このレポートは、24の公式欧州連合言語すべてと11の追加言語をカバーするこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment

要約 具体化されたエージェントの一部として、ユーザーからの自然言語の指示を考慮し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | コメントする

TextAtari: 100K Frames Game Playing with Language Agents

要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

CLAIM: An Intent-Driven Multi-Agent Framework for Analyzing Manipulation in Courtroom Dialogues

要約 法廷は、命が決定され、運命が封印される場所であるが、操作は不浸透ではない。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory

要約 最近、大規模な言語モデル(LLM)でのスケーリングテスト時間コンピューティ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Does Thinking More always Help? Understanding Test-Time Scaling in Reasoning Models

要約 推論モデルのテスト時間スケーリングの最近の傾向(例:Openai O1、D … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Efficient Knowledge Editing via Minimal Precomputation

要約 Memitのような知識編集方法は、単一の文を使用して事実とその結果を更新す … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする