cs.AI」カテゴリーアーカイブ

Agent Context Protocols Enhance Collective Inference

要約 AIエージェントは、コーディング、推論、マルチモーダルの理解などの複雑なタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Agent Context Protocols Enhance Collective Inference はコメントを受け付けていません

Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare

要約 ヘルスケア用のAI駆動型ツールは、医療従事者や患者にとって潜在的に有益であ … 続きを読む

カテゴリー: cs.AI | Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare はコメントを受け付けていません

Online Scheduling for LLM Inference with KV Cache Constraints

要約 トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Online Scheduling for LLM Inference with KV Cache Constraints はコメントを受け付けていません

Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs

要約 \ textbf {c} ross-llingual \ textbf { … 続きを読む

カテゴリー: cs.AI, cs.CL | Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs はコメントを受け付けていません

Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models

要約 大規模な言語モデル(LLM)は、バイオメディシンなどの科学分野、特に仮説生 … 続きを読む

カテゴリー: cs.AI, cs.CL | Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models はコメントを受け付けていません

Towards a Foundation Model for Communication Systems

要約 人工知能(AI)は、さまざまなドメインで前例のないパフォーマンスを実証して … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.SP | Towards a Foundation Model for Communication Systems はコメントを受け付けていません

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

要約 S1-Benchを紹介します。S1-Benchは、審議システム2の推論では … 続きを読む

カテゴリー: cs.AI, cs.CL | S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models はコメントを受け付けていません

Let LLMs Break Free from Overthinking via Self-Braking Tuning

要約 Openai O1やDeepseek-R1などの大きな推論モデル(LRMS … 続きを読む

カテゴリー: cs.AI | Let LLMs Break Free from Overthinking via Self-Braking Tuning はコメントを受け付けていません

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

要約 マシンテキスト検出器の開発においてかなりの進歩にもかかわらず、問題は本質的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It) はコメントを受け付けていません

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

要約 Satbenchを紹介します。これは、ブールの満足度(SAT)の問題から派 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas はコメントを受け付けていません