cs.SE」カテゴリーアーカイブ

MetaTool Benchmark for Large Language Models: Deciding Whether to Use Tools and Which to Use

要約 大規模言語モデル (LLM) は、その優れた自然言語処理 (NLP) 機能 … 続きを読む

カテゴリー: cs.CL, cs.SE | MetaTool Benchmark for Large Language Models: Deciding Whether to Use Tools and Which to Use はコメントを受け付けていません

On the Security Vulnerabilities of Text-to-SQL Models

要約 自然言語処理 (NLP) アルゴリズムが意図的な攻撃に対して脆弱であること … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.DB, cs.LG, cs.SE | On the Security Vulnerabilities of Text-to-SQL Models はコメントを受け付けていません

BertRLFuzzer: A BERT and Reinforcement Learning based Fuzzer

要約 我々は、Web アプリケーションのセキュリティ脆弱性を発見することを目的と … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.SE | BertRLFuzzer: A BERT and Reinforcement Learning based Fuzzer はコメントを受け付けていません

Learning from Very Little Data: On the Value of Landscape Analysis for Predicting Software Project Health

要約 データが不足している場合、ソフトウェア分析は多くの間違いを犯す可能性があり … 続きを読む

カテゴリー: cs.LG, cs.SE | Learning from Very Little Data: On the Value of Landscape Analysis for Predicting Software Project Health はコメントを受け付けていません

Test & Evaluation Best Practices for Machine Learning-Enabled Systems

要約 機械学習 (ML) ベースのソフトウェア システムは、さまざまな分野で急速 … 続きを読む

カテゴリー: cs.LG, cs.SE | Test & Evaluation Best Practices for Machine Learning-Enabled Systems はコメントを受け付けていません

Benchmarking and Explaining Large Language Model-based Code Generation: A Causality-Centric Approach

要約 コード生成はさまざまなソフトウェア開発シナリオで広く使用されていますが、生 … 続きを読む

カテゴリー: cs.AI, cs.SE | Benchmarking and Explaining Large Language Model-based Code Generation: A Causality-Centric Approach はコメントを受け付けていません

DeepLSH: Deep Locality-Sensitive Hash Learning for Fast and Efficient Near-Duplicate Crash Report Detection

要約 自動クラッシュ バケット化は、バグ レポートを効率的に優先順位付けするため … 続きを読む

カテゴリー: cs.AI, cs.SE | DeepLSH: Deep Locality-Sensitive Hash Learning for Fast and Efficient Near-Duplicate Crash Report Detection はコメントを受け付けていません

Look Before You Leap: An Exploratory Study of Uncertainty Measurement for Large Language Models

要約 最近の大規模言語モデル (LLM) のパフォーマンスの飛躍的な進歩により、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | Look Before You Leap: An Exploratory Study of Uncertainty Measurement for Large Language Models はコメントを受け付けていません

SWE-bench: Can Language Models Resolve Real-World GitHub Issues?

要約 言語モデルは、それを効果的に評価する私たちの能力を上回っていますが、将来の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | SWE-bench: Can Language Models Resolve Real-World GitHub Issues? はコメントを受け付けていません

DeepQTest: Testing Autonomous Driving Systems with Reinforcement Learning and Real-world Weather Data

要約 自動運転システム (ADS) は、環境を感知し、自律的に運転の意思決定を行 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SE | DeepQTest: Testing Autonomous Driving Systems with Reinforcement Learning and Real-world Weather Data はコメントを受け付けていません