月別アーカイブ: 2025年5月

WebGen-Bench: Evaluating LLMs on Generating Interactive and Functional Websites from Scratch

要約 LLMベースのエージェントは、複雑なコードベース内でコードを生成および管理 … 続きを読む

カテゴリー: cs.CL | WebGen-Bench: Evaluating LLMs on Generating Interactive and Functional Websites from Scratch はコメントを受け付けていません

HAIR: Hardness-Aware Inverse Reinforcement Learning with Introspective Reasoning for LLM Alignment

要約 大規模な言語モデル(LLMS)と人間の価値の調整は、重要なものであるが、4 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | HAIR: Hardness-Aware Inverse Reinforcement Learning with Introspective Reasoning for LLM Alignment はコメントを受け付けていません

STORY2GAME: Generating (Almost) Everything in an Interactive Fiction Game

要約 Story2Gameを紹介します。これは、大規模な言語モデルを使用して、ス … 続きを読む

カテゴリー: cs.AI | STORY2GAME: Generating (Almost) Everything in an Interactive Fiction Game はコメントを受け付けていません

A Hashgraph-Inspired Consensus Mechanism for Reliable Multi-Model Reasoning

要約 大規模な言語モデル(LLM)からの一貫性のない出力と幻覚は、信頼できるAI … 続きを読む

カテゴリー: cs.AI, cs.DC | A Hashgraph-Inspired Consensus Mechanism for Reliable Multi-Model Reasoning はコメントを受け付けていません

Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models

要約 視覚ターゲットナビゲーションは、未知の環境、特に人間とロボットの相互作用シ … 続きを読む

カテゴリー: cs.AI, cs.RO | Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models はコメントを受け付けていません

Rapid AI-based generation of coverage paths for dispensing applications

要約 カバレッジパスサーマルインターフェイス材料(TIM)の計画は、電子電子機器 … 続きを読む

カテゴリー: cs.AI, cs.LG | Rapid AI-based generation of coverage paths for dispensing applications はコメントを受け付けていません

Ergodic Generative Flows

要約 生成フローネットワーク(GFN)は、正規化されていない分布密度からサンプリ … 続きを読む

カテゴリー: 37A25, 68Q87, 68T07, 68T99, 68W20, cs.AI, cs.LG, math.DG, math.DS | Ergodic Generative Flows はコメントを受け付けていません

The Adaptive Arms Race: Redefining Robustness in AI Security

要約 それらを堅牢にするためのかなりの努力にもかかわらず、現実世界のAIベースの … 続きを読む

カテゴリー: cs.AI, cs.CR | The Adaptive Arms Race: Redefining Robustness in AI Security はコメントを受け付けていません

OSUniverse: Benchmark for Multimodal GUI-navigation AI Agents

要約 このホワイトペーパーでは、Osuniverseを紹介します。これは、使いや … 続きを読む

カテゴリー: cs.AI | OSUniverse: Benchmark for Multimodal GUI-navigation AI Agents はコメントを受け付けていません

LlamaFirewall: An open source guardrail system for building secure AI agents

要約 大規模な言語モデル(LLMS)は、シンプルなチャットボットから、本番コード … 続きを読む

カテゴリー: cs.AI, cs.CR | LlamaFirewall: An open source guardrail system for building secure AI agents はコメントを受け付けていません