cs.SE」カテゴリーアーカイブ

A Survey on the Safety and Security Threats of Computer-Using Agents: JARVIS or Ultron?

要約 最近、コンピューティングデバイスとのAI駆動型の相互作用は、基本的なプロト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV, cs.SE | A Survey on the Safety and Security Threats of Computer-Using Agents: JARVIS or Ultron? はコメントを受け付けていません

LLM assisted web application functional requirements generation: A case study of four popular LLMs over a Mess Management System

要約 他の分野と同様に、大規模な言語モデル(LLM)は、ソフトウェア開発のさまざ … 続きを読む

カテゴリー: cs.AI, cs.SE | LLM assisted web application functional requirements generation: A case study of four popular LLMs over a Mess Management System はコメントを受け付けていません

Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks

要約 大規模な言語モデル(LLMS)の最近の進歩は、機能レベルのコード生成に有望 … 続きを読む

カテゴリー: cs.LG, cs.SE | Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks はコメントを受け付けていません

SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development

要約 大規模な言語モデル(LLM)は、多様なソフトウェアエンジニアリングタスクに … 続きを読む

カテゴリー: cs.CL, cs.SE | SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development はコメントを受け付けていません

UniSTPA: A Safety Analysis Framework for End-to-End Autonomous Driving

要約 自律運転技術が進歩し続けるにつれて、エンドツーエンドモデルは、優れた一般化 … 続きを読む

カテゴリー: cs.RO, cs.SE | UniSTPA: A Safety Analysis Framework for End-to-End Autonomous Driving はコメントを受け付けていません

HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement

要約 正式な方法は、厳格な数学的証拠を通じて重要なシステムの信頼性を検証するため … 続きを読む

カテゴリー: cs.AI, cs.FL, cs.SE | HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement はコメントを受け付けていません

SWE-smith: Scaling Data for Software Engineering Agents

要約 ソフトウェアエンジニアリングの言語モデル(LMS)の最近の進歩にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | SWE-smith: Scaling Data for Software Engineering Agents はコメントを受け付けていません

On-Demand Scenario Generation for Testing Automated Driving Systems

要約 自動化された運転システム(ADS)の安全性と信頼性は最重要であり、展開前に … 続きを読む

カテゴリー: cs.RO, cs.SE | On-Demand Scenario Generation for Testing Automated Driving Systems はコメントを受け付けていません

EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking

要約 大規模な言語モデル(LLM)がコード関連のタスクに不可欠になると、中心的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking はコメントを受け付けていません

XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants

要約 AIコーディングアシスタントは、コード生成などのタスクに広く使用されていま … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.SE | XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants はコメントを受け付けていません