「cs.AI」カテゴリーアーカイブ

Word Sense Disambiguation in Native Spanish: A Comprehensive Lexical Evaluation Resource

投稿日: 2024年10月1日作成者: jarxiv

要約人間の言語は、意味を伝えることを目的としていますが、本質的に曖昧さを伴いま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

On the Resilience of Multi-Agent Systems with Malicious Agents

投稿日: 2024年10月1日作成者: jarxiv

要約大規模な言語モデルを活用したマルチエージェントシステムは、それぞれが特定 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

FABLES: Evaluating faithfulness and content selection in book-length summarization

投稿日: 2024年10月1日作成者: jarxiv

要約ロングコンテキストのラージ言語モデル (LLM) は、技術的には書籍サイズ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Robi Butler: Remote Multimodal Interactions with Household Robot Assistant

投稿日: 2024年10月1日作成者: jarxiv

要約この論文では、遠隔ユーザーとのマルチモーダルな対話を可能にする新しい家庭用 … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.RO | コメントを受け付けていません

The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance

投稿日: 2024年10月1日作成者: jarxiv

要約 Cloze テストは、多数のベンチマークタスクで大規模な言語モデルの動作 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

LLM Hallucinations in Practical Code Generation: Phenomena, Mechanism, and Mitigation

投稿日: 2024年10月1日作成者: jarxiv

要約コード生成は、入力された要件からコードを自動的に生成し、開発効率を大幅に向 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

Maia-2: A Unified Model for Human-AI Alignment in Chess

投稿日: 2024年10月1日作成者: jarxiv

要約人工知能 (AI) システムが人間の能力を超え、人間の行動を正確にモデル化 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner

投稿日: 2024年10月1日作成者: jarxiv

要約言語モデル (LM) は自然言語を理解する強力な能力を備えており、人間の指 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | コメントを受け付けていません

Continuously Improving Mobile Manipulation with Autonomous Real-World RL

投稿日: 2024年10月1日作成者: jarxiv

要約我々は、広範な機器や人間による監視なしでポリシーを学習できる、モバイル操作 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity

投稿日: 2024年10月1日作成者: jarxiv

要約言語モデルが ASCII アートを解釈できないことを利用した、新しい敵対的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Word Sense Disambiguation in Native Spanish: A Comprehensive Lexical Evaluation Resource

On the Resilience of Multi-Agent Systems with Malicious Agents

FABLES: Evaluating faithfulness and content selection in book-length summarization

Robi Butler: Remote Multimodal Interactions with Household Robot Assistant

The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance

LLM Hallucinations in Practical Code Generation: Phenomena, Mechanism, and Mitigation

Maia-2: A Unified Model for Human-AI Alignment in Chess

LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner

Continuously Improving Mobile Manipulation with Autonomous Real-World RL

Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity

最近の投稿

最近のコメント

アーカイブ

カテゴリー