「D.2.5」カテゴリーアーカイブ

Active Testing of Large Language Model via Multi-Stage Sampling

投稿日: 2024年8月8日作成者: jarxiv

要約パフォーマンス評価は、大規模言語モデル (LLM) の開発ライフサイクル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE, D.2.5 | コメントを受け付けていません

投稿日: 2024年8月8日作成者: jarxiv

要約アクセシビリティはアプリの使いやすさにとって重要ですが、開発者は認識、専門 … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.SE, D.2.5 | コメントを受け付けていません

投稿日: 2024年7月12日作成者: jarxiv

要約 Modelizer を紹介します。これは、ブラックボックスプログラムを与 … 続きを読む →

カテゴリー: (Primary), 68Q42, cs.LG, cs.SE, D.2.5, secondary | コメントを受け付けていません

投稿日: 2024年7月1日作成者: jarxiv

要約強化学習 (RL) は、さまざまな分野で大きな注目を集めています。ただし … 続きを読む →

カテゴリー: 68T05, 68T27, 93C42, cs.AI, cs.SE, D.2.5 | コメントを受け付けていません

投稿日: 2024年6月24日作成者: jarxiv

要約 Needle-in-a-Haystack (NIAH) ベンチマークの最近 … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.SE, D.2.5 | コメントを受け付けていません

投稿日: 2024年4月26日作成者: jarxiv

要約シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するた … 続きを読む →

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | コメントを受け付けていません