cs.AI」カテゴリーアーカイブ

Word Sense Disambiguation in Native Spanish: A Comprehensive Lexical Evaluation Resource

要約 人間の言語は、意味を伝えることを目的としていますが、本質的に曖昧さを伴いま … 続きを読む

カテゴリー: cs.AI, cs.CL | Word Sense Disambiguation in Native Spanish: A Comprehensive Lexical Evaluation Resource はコメントを受け付けていません

On the Resilience of Multi-Agent Systems with Malicious Agents

要約 大規模な言語モデルを活用したマルチエージェント システムは、それぞれが特定 … 続きを読む

カテゴリー: cs.AI | On the Resilience of Multi-Agent Systems with Malicious Agents はコメントを受け付けていません

FABLES: Evaluating faithfulness and content selection in book-length summarization

要約 ロングコンテキストのラージ言語モデル (LLM) は、技術的には書籍サイズ … 続きを読む

カテゴリー: cs.AI, cs.CL | FABLES: Evaluating faithfulness and content selection in book-length summarization はコメントを受け付けていません

Robi Butler: Remote Multimodal Interactions with Household Robot Assistant

要約 この論文では、遠隔ユーザーとのマルチモーダルな対話を可能にする新しい家庭用 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | Robi Butler: Remote Multimodal Interactions with Household Robot Assistant はコメントを受け付けていません

The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance

要約 Cloze テストは、多数のベンチマーク タスクで大規模な言語モデルの動作 … 続きを読む

カテゴリー: cs.AI, cs.CL | The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance はコメントを受け付けていません

LLM Hallucinations in Practical Code Generation: Phenomena, Mechanism, and Mitigation

要約 コード生成は、入力された要件からコードを自動的に生成し、開発効率を大幅に向 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | LLM Hallucinations in Practical Code Generation: Phenomena, Mechanism, and Mitigation はコメントを受け付けていません

Maia-2: A Unified Model for Human-AI Alignment in Chess

要約 人工知能 (AI) システムが人間の能力を超え、人間の行動を正確にモデル化 … 続きを読む

カテゴリー: cs.AI | Maia-2: A Unified Model for Human-AI Alignment in Chess はコメントを受け付けていません

LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner

要約 言語モデル (LM) は自然言語を理解する強力な能力を備えており、人間の指 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner はコメントを受け付けていません

Continuously Improving Mobile Manipulation with Autonomous Real-World RL

要約 我々は、広範な機器や人間による監視なしでポリシーを学習できる、モバイル操作 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Continuously Improving Mobile Manipulation with Autonomous Real-World RL はコメントを受け付けていません

Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity

要約 言語モデルが ASCII アートを解釈できないことを利用した、新しい敵対的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity はコメントを受け付けていません