cs.AI」カテゴリーアーカイブ

The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance

要約 Cloze テストは、多数のベンチマーク タスクで大規模な言語モデルの動作 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

LLM Hallucinations in Practical Code Generation: Phenomena, Mechanism, and Mitigation

要約 コード生成は、入力された要件からコードを自動的に生成し、開発効率を大幅に向 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | コメントする

Maia-2: A Unified Model for Human-AI Alignment in Chess

要約 人工知能 (AI) システムが人間の能力を超え、人間の行動を正確にモデル化 … 続きを読む

カテゴリー: cs.AI | コメントする

LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner

要約 言語モデル (LM) は自然言語を理解する強力な能力を備えており、人間の指 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | コメントする

Continuously Improving Mobile Manipulation with Autonomous Real-World RL

要約 我々は、広範な機器や人間による監視なしでポリシーを学習できる、モバイル操作 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | コメントする

Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity

要約 言語モデルが ASCII アートを解釈できないことを利用した、新しい敵対的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | コメントする

UniEmoX: Cross-modal Semantic-Guided Large-Scale Pretraining for Universal Scene Emotion Perception

要約 視覚的感情分析は、コンピューター ビジョンと心理学の両方において重要な研究 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Robo-CSK-Organizer: Commonsense Knowledge to Organize Detected Objects for Multipurpose Robots

要約 この論文では、ロボットのコンテキスト認識能力を強化するために古典的な知識か … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.6 | コメントする

Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly

要約 我々は、3D 生成人工知能とロボットの組み立てを組み合わせることにより、音 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | コメントする

BoT-Drive: Hierarchical Behavior and Trajectory Planning for Autonomous Driving using POMDPs

要約 動的な道路環境の不確実性は、自動運転における動作と軌道計画に重大な課題をも … 続きを読む

カテゴリー: cs.AI, cs.RO | コメントする