cs.SE」カテゴリーアーカイブ

Generating Automotive Code: Large Language Models for Software Development and Verification in Safety-Critical Systems

要約 安全性が批判的な自動車ソフトウェアの開発は、システムの複雑さと厳格な規制の … 続きを読む

カテゴリー: cs.AI, cs.SE | コメントする

LoRACode: LoRA Adapters for Code Embeddings

要約 セマンティックコード検索には、コード埋め込みが不可欠です。 ただし、現在の … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SE | コメントする

Behavioral Safety Assessment towards Large-scale Deployment of Autonomous Vehicles

要約 自動運転車(AV)は近年、現実世界の展開において大幅に進歩していますが、安 … 続きを読む

カテゴリー: cs.RO, cs.SE | コメントする

Otter: Generating Tests from Issues to Validate SWE Patches

要約 既存のコードからテストを生成することには多くの作業がありましたが、問題から … 続きを読む

カテゴリー: cs.LG, cs.SE | コメントする

Structural Abstraction and Selective Refinement for Formal Verification

要約 ロボットアプリケーションの安全検証は、ロボットが通常動作する環境の複雑さの … 続きを読む

カテゴリー: cs.RO, cs.SE | コメントする

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

要約 言語モデル(LMS)は、標準化されたコーディングベンチマークでうまく機能し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | コメントする

GSO: Challenging Software Optimization Tasks for Evaluating SWE-Agents

要約 高性能ソフトウェアの開発は、専門的な専門知識を必要とする複雑なタスクです。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントする

LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents

要約 科学的具体化されたエージェントは、複雑な実験ワークフローを自動化することに … 続きを読む

カテゴリー: cs.RO, cs.SE | LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents はコメントを受け付けていません

GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git

要約 ソフトウェアエンジニアリング(SE)のベンチマーク(SE)AIエージェント … 続きを読む

カテゴリー: cs.AI, cs.SE | GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git はコメントを受け付けていません

Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare

要約 電子健康記録(EHRS)の台頭は、医学研究の新しい機会を解き放ちましたが、 … 続きを読む

カテゴリー: cs.LG, cs.SE | Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare はコメントを受け付けていません