I.2.1」カテゴリーアーカイブ

A Llama walks into the ‘Bar’: Efficient Supervised Fine-Tuning for Legal Reasoning in the Multi-state Bar Exam

要約 法的推論タスクは、ドメイン固有の知識と推論プロセスの複雑さのために、大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.1 | コメントする

Dense Neural Network Based Arrhythmia Classification on Low-cost and Low-compute Micro-controller

要約 心電図(ECG)モニター装置は、心血管疾患(CVD)の治療と診断に不可欠な … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.1 | コメントする

YourBench: Easy Custom Evaluation Sets for Everyone

要約 従来の静的ベンチマークが飽和と汚染に悩まされている一方で、人間の評価は費用 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.1 | コメントする

ASP-based Multi-shot Reasoning via DLV2 with Incremental Grounding

要約 DLV2は、アカデミックアプリケーションと産業用アプリケーションの両方で使 … 続きを読む

カテゴリー: 68T30, cs.AI, I.2.1 | コメントする

AutoTRIZ: Automating Engineering Innovation with TRIZ and Large Language Models

要約 形態学的分析やアナロジーごとのデザインなどのさまざまなアイデア方法が、創造 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, I.2.1 | AutoTRIZ: Automating Engineering Innovation with TRIZ and Large Language Models はコメントを受け付けていません

FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction

要約 タンパク質リガンド構造の強力な生成AIモデルが最近提案されていますが、これ … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.1, q-bio.BM, q-bio.QM | FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction はコメントを受け付けていません

CVE-Bench: A Benchmark for AI Agents’ Ability to Exploit Real-World Web Application Vulnerabilities

要約 大規模な言語モデル(LLM)エージェントは、サイバー攻撃を自律的に実施する … 続きを読む

カテゴリー: cs.AI, cs.CR, I.2.1 | CVE-Bench: A Benchmark for AI Agents’ Ability to Exploit Real-World Web Application Vulnerabilities はコメントを受け付けていません

MAP: Multi-user Personalization with Collaborative LLM-powered Agents

要約 マルチユーザー設定における大規模な言語モデル(LLMS)およびLLM駆動エ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO, I.2.1 | MAP: Multi-user Personalization with Collaborative LLM-powered Agents はコメントを受け付けていません

Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis

要約 ゼロタッチネットワーク(ZTNS)は、完全に自動化されたインテリジェントな … 続きを読む

カテゴリー: 68T01, 90C31, cs.CR, cs.LG, cs.NI, I.2.1 | Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis はコメントを受け付けていません

A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models

要約 ディープ強化学習(RL)は、ロボット工学、輸送、推奨システムなど、さまざま … 続きを読む

カテゴリー: 68T05, 68U05, cs.AI, cs.LG, cs.RO, I.2.1 | A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models はコメントを受け付けていません