D.2.5」カテゴリーアーカイブ

Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約 シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するた … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing はコメントを受け付けていません

Active Testing of Large Language Model via Multi-Stage Sampling

要約 パフォーマンス評価は、大規模言語モデル (LLM) の開発ライフ サイクル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE, D.2.5 | Active Testing of Large Language Model via Multi-Stage Sampling はコメントを受け付けていません

Automated Code Fix Suggestions for Accessibility Issues in Mobile Apps

要約 アクセシビリティはアプリの使いやすさにとって重要ですが、開発者は認識、専門 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SE, D.2.5 | Automated Code Fix Suggestions for Accessibility Issues in Mobile Apps はコメントを受け付けていません

Learning Program Behavioral Models from Synthesized Input-Output Pairs

要約 Modelizer を紹介します。これは、ブラックボックス プログラムを与 … 続きを読む

カテゴリー: (Primary), 68Q42, cs.LG, cs.SE, D.2.5, secondary | Learning Program Behavioral Models from Synthesized Input-Output Pairs はコメントを受け付けていません

Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs

要約 強化学習 (RL) は、さまざまな分野で大きな注目を集めています。 ただし … 続きを読む

カテゴリー: 68T05, 68T27, 93C42, cs.AI, cs.SE, D.2.5 | Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs はコメントを受け付けていません

Bug In the Code Stack: Can LLMs Find Bugs in Large Python Code Stacks

要約 Needle-in-a-Haystack (NIAH) ベンチマークの最近 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.SE, D.2.5 | Bug In the Code Stack: Can LLMs Find Bugs in Large Python Code Stacks はコメントを受け付けていません

Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約 シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するた … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing はコメントを受け付けていません