「cs.AI」カテゴリーアーカイブ

Agent Context Protocols Enhance Collective Inference

投稿日: 2025年5月21日作成者: jarxiv

要約 AIエージェントは、コーディング、推論、マルチモーダルの理解などの複雑なタ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare

投稿日: 2025年5月21日作成者: jarxiv

要約ヘルスケア用のAI駆動型ツールは、医療従事者や患者にとって潜在的に有益であ … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Online Scheduling for LLM Inference with KV Cache Constraints

投稿日: 2025年5月21日作成者: jarxiv

要約トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs

投稿日: 2025年5月21日作成者: jarxiv

要約 \ textbf {c} ross-llingual \ textbf { … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLM）は、バイオメディシンなどの科学分野、特に仮説生 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Towards a Foundation Model for Communication Systems

投稿日: 2025年5月21日作成者: jarxiv

要約人工知能（AI）は、さまざまなドメインで前例のないパフォーマンスを実証して … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.SP | コメントを受け付けていません

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

投稿日: 2025年5月21日作成者: jarxiv

要約 S1-Benchを紹介します。S1-Benchは、審議システム2の推論では … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Let LLMs Break Free from Overthinking via Self-Braking Tuning

投稿日: 2025年5月21日作成者: jarxiv

要約 Openai O1やDeepseek-R1などの大きな推論モデル（LRMS … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

投稿日: 2025年5月21日作成者: jarxiv

要約マシンテキスト検出器の開発においてかなりの進歩にもかかわらず、問題は本質的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

投稿日: 2025年5月21日作成者: jarxiv

要約 Satbenchを紹介します。これは、ブールの満足度（SAT）の問題から派 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Agent Context Protocols Enhance Collective Inference

Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare

Online Scheduling for LLM Inference with KV Cache Constraints

Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs

Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models

Towards a Foundation Model for Communication Systems

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

Let LLMs Break Free from Overthinking via Self-Braking Tuning

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

最近の投稿

最近のコメント

アーカイブ

カテゴリー