cs.SE」カテゴリーアーカイブ

PROSKILL: A formal skill language for acting in robotics

要約 演技は、自律的なロボットにとって重要な決定機能です。 演技は、それが監督す … 続きを読む

カテゴリー: cs.RO, cs.SE | PROSKILL: A formal skill language for acting in robotics はコメントを受け付けていません

ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms

要約 ユニットテストの生成は、LLMSの有望で重要なユースケースになっています。 … 続きを読む

カテゴリー: cs.CL, cs.SE | ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms はコメントを受け付けていません

Where’s the Bug? Attention Probing for Scalable Fault Localization

要約 コード関連のタスクでは、大規模な言語モデル(LLM)がますます能力があるに … 続きを読む

カテゴリー: cs.LG, cs.SE | Where’s the Bug? Attention Probing for Scalable Fault Localization はコメントを受け付けていません

CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents

要約 セマンティックコード検索、特定の自然言語クエリに一致するコードの取得は、ソ … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.SE, D.2.3 | CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents はコメントを受け付けていません

Exploring Code Language Models for Automated HLS-based Hardware Generation: Benchmark, Infrastructure and Analysis

要約 コード生成の最近の進歩により、PythonやC ++などの汎用プログラミン … 続きを読む

カテゴリー: cs.AR, cs.LG, cs.SE | Exploring Code Language Models for Automated HLS-based Hardware Generation: Benchmark, Infrastructure and Analysis はコメントを受け付けていません

Where’s the Bug? Attention Probing for Scalable Fault Localization

要約 コード関連のタスクでは、大規模な言語モデル(LLM)がますます能力があるに … 続きを読む

カテゴリー: cs.LG, cs.SE | Where’s the Bug? Attention Probing for Scalable Fault Localization はコメントを受け付けていません

Scoring Verifiers: Evaluating Synthetic Verification in Code and Reasoning

要約 コード検証は最近、コーディングのための大規模な推論モデルをトレーニングする … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | Scoring Verifiers: Evaluating Synthetic Verification in Code and Reasoning はコメントを受け付けていません

CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents

要約 セマンティックコード検索、特定の自然言語クエリに一致するコードの取得は、ソ … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.SE, D.2.3 | CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents はコメントを受け付けていません

CONSTRUCTA: Automating Commercial Construction Schedules in Fabrication Facilities with Large Language Models

要約 LLMSで計画を自動化することは、伝統的な産業に変革的な機会をもたらします … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | CONSTRUCTA: Automating Commercial Construction Schedules in Fabrication Facilities with Large Language Models はコメントを受け付けていません

Predicting Safety Misbehaviours in Autonomous Driving Systems using Uncertainty Quantification

要約 予期しない状況の自動リアルタイム認識は、特にサポートされていない予測不可能 … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SE | Predicting Safety Misbehaviours in Autonomous Driving Systems using Uncertainty Quantification はコメントを受け付けていません