cs.SE」カテゴリーアーカイブ

AFlow: Automating Agentic Workflow Generation

要約 大規模言語モデル (LLM) は、通常、詳細な指示と操作シーケンスに従うエ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | AFlow: Automating Agentic Workflow Generation はコメントを受け付けていません

Test-driven Software Experimentation with LASSO: an LLM Benchmarking Example

要約 経験的ソフトウェア エンジニアリングは、重大なギャップに直面しています。そ … 続きを読む

カテゴリー: cs.AI, cs.SE, D.2.1 | Test-driven Software Experimentation with LASSO: an LLM Benchmarking Example はコメントを受け付けていません

Multimodal Auto Validation For Self-Refinement in Web Agents

要約 世界がデジタル化するにつれ、複雑で単調なタスクを自動化できる Web エー … 続きを読む

カテゴリー: cs.AI, cs.SE | Multimodal Auto Validation For Self-Refinement in Web Agents はコメントを受け付けていません

An Ontology-based Approach Towards Traceable Behavior Specifications in Automated Driving

要約 自動運転システムを搭載した公共交通機関の車両には、さまざまな期待が求められ … 続きを読む

カテゴリー: cs.AI, cs.SE, cs.SY, eess.SY | An Ontology-based Approach Towards Traceable Behavior Specifications in Automated Driving はコメントを受け付けていません

Software Engineering and Foundation Models: Insights from Industry Blogs Using a Jury of Foundation Models

要約 大規模言語モデル (LLM) などの基盤モデル (FM) は、ソフトウェア … 続きを読む

カテゴリー: cs.AI, cs.SE | Software Engineering and Foundation Models: Insights from Industry Blogs Using a Jury of Foundation Models はコメントを受け付けていません

Robotic framework for autonomous manipulation of laboratory equipment with different degrees of transparency via 6D pose estimation

要約 現代のロボット システムの多くは自律的に動作しますが、環境を正確に分析して … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SE, cs.SY, eess.SY | Robotic framework for autonomous manipulation of laboratory equipment with different degrees of transparency via 6D pose estimation はコメントを受け付けていません

miniCodeProps: a Minimal Benchmark for Proving Code Properties

要約 AI エージェントは、Lean などの証明アシスタントでの数学定理証明の自 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | miniCodeProps: a Minimal Benchmark for Proving Code Properties はコメントを受け付けていません

Hammer: Robust Function-Calling for On-Device Language Models via Function Masking

要約 大規模な言語モデルは、外部ツールや API 呼び出しを備えた場合に自律エー … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | Hammer: Robust Function-Calling for On-Device Language Models via Function Masking はコメントを受け付けていません

$\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases

要約 優先学習は、正しいコードと間違ったコードを区別するようにモデルが明示的にト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | $\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases はコメントを受け付けていません

Overcoming Autoware-Ubuntu Incompatibility in Autonomous Driving Systems-Equipped Vehicles: Lessons Learned

要約 自動運転車は、交通システムに安全性と効率性を提供する需要に応じて急速に開発 … 続きを読む

カテゴリー: cs.OS, cs.RO, cs.SE | Overcoming Autoware-Ubuntu Incompatibility in Autonomous Driving Systems-Equipped Vehicles: Lessons Learned はコメントを受け付けていません