D.2.5」カテゴリーアーカイブ

Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues

要約 今日のデジタル環境では、タイムリーかつ正確な脆弱性検出の重要性が大幅に高ま … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.SE, D.2.5 | コメントする

An LSTM-based Test Selection Method for Self-Driving Cars

要約 自動運転車には大規模なテストが必要であり、時間の面でコストがかかる可能性が … 続きを読む

カテゴリー: cs.RO, cs.SE, D.2.5 | An LSTM-based Test Selection Method for Self-Driving Cars はコメントを受け付けていません

Benchmarking Generative AI Models for Deep Learning Test Input Generation

要約 テスト入力ジェネレーター (TIG) は、ディープラーニング (DL) 画 … 続きを読む

カテゴリー: cs.LG, cs.SE, D.2.5 | Benchmarking Generative AI Models for Deep Learning Test Input Generation はコメントを受け付けていません

Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約 シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するた … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing はコメントを受け付けていません

Active Testing of Large Language Model via Multi-Stage Sampling

要約 パフォーマンス評価は、大規模言語モデル (LLM) の開発ライフ サイクル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE, D.2.5 | Active Testing of Large Language Model via Multi-Stage Sampling はコメントを受け付けていません

Automated Code Fix Suggestions for Accessibility Issues in Mobile Apps

要約 アクセシビリティはアプリの使いやすさにとって重要ですが、開発者は認識、専門 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SE, D.2.5 | Automated Code Fix Suggestions for Accessibility Issues in Mobile Apps はコメントを受け付けていません

Learning Program Behavioral Models from Synthesized Input-Output Pairs

要約 Modelizer を紹介します。これは、ブラックボックス プログラムを与 … 続きを読む

カテゴリー: (Primary), 68Q42, cs.LG, cs.SE, D.2.5, secondary | Learning Program Behavioral Models from Synthesized Input-Output Pairs はコメントを受け付けていません

Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs

要約 強化学習 (RL) は、さまざまな分野で大きな注目を集めています。 ただし … 続きを読む

カテゴリー: 68T05, 68T27, 93C42, cs.AI, cs.SE, D.2.5 | Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs はコメントを受け付けていません

Bug In the Code Stack: Can LLMs Find Bugs in Large Python Code Stacks

要約 Needle-in-a-Haystack (NIAH) ベンチマークの最近 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.SE, D.2.5 | Bug In the Code Stack: Can LLMs Find Bugs in Large Python Code Stacks はコメントを受け付けていません

Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約 シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するた … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing はコメントを受け付けていません