cs.SE」カテゴリーアーカイブ

Benchmarks and Metrics for Evaluations of Code Generation: A Critical Review

要約 大規模言語モデル (LLM) の急速な発展に伴い、自然言語入力からのプログ … 続きを読む

カテゴリー: cs.AI, cs.SE | Benchmarks and Metrics for Evaluations of Code Generation: A Critical Review はコメントを受け付けていません

Identifying Performance-Sensitive Configurations in Software Systems through Code Analysis with LLM Agents

要約 構成設定は、特定のパフォーマンス要件を満たすようにソフトウェアの動作を調整 … 続きを読む

カテゴリー: cs.AI, cs.SE | Identifying Performance-Sensitive Configurations in Software Systems through Code Analysis with LLM Agents はコメントを受け付けていません

Measuring memorization in RLHF for code completion

要約 ヒューマン フィードバックによる強化学習 (RLHF) は、大規模なモデル … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | Measuring memorization in RLHF for code completion はコメントを受け付けていません

MASAI: Modular Architecture for Software-engineering AI Agents

要約 ソフトウェアエンジニアリングにおける複雑な問題を解決する一般的な方法は、問 … 続きを読む

カテゴリー: cs.AI, cs.SE | MASAI: Modular Architecture for Software-engineering AI Agents はコメントを受け付けていません

ChartMimic: Evaluating LMM’s Cross-Modal Reasoning Capability via Chart-to-Code Generation

要約 大規模マルチモーダル モデル (LMM) の視覚に基づいたコード生成機能を … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SE | ChartMimic: Evaluating LMM’s Cross-Modal Reasoning Capability via Chart-to-Code Generation はコメントを受け付けていません

Generative AI to Generate Test Data Generators

要約 データ偽装ライブラリの数と重要性が示すように、偽データの生成は現代のソフト … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | Generative AI to Generate Test Data Generators はコメントを受け付けていません

The Rise and Fall(?) of Software Engineering

要約 過去 10 年間、人工知能 (AI) の分野では革命的な進歩が爆発的に起こ … 続きを読む

カテゴリー: cs.AI, cs.SE, I.2 | The Rise and Fall(?) of Software Engineering はコメントを受け付けていません

Is Programming by Example solved by LLMs?

要約 Programming-by-Examples (PBE) は、入出力サン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | Is Programming by Example solved by LLMs? はコメントを受け付けていません

Is Programming by Example solved by LLMs?

要約 Programming-by-Examples (PBE) は、入出力サン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | Is Programming by Example solved by LLMs? はコメントを受け付けていません

DafnyBench: A Benchmark for Formal Software Verification

要約 正式なソフトウェア検証のための機械学習システムのトレーニングと評価を行うた … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PL, cs.SE | DafnyBench: A Benchmark for Formal Software Verification はコメントを受け付けていません