投稿者「jarxiv」のアーカイブ

Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs

要約 \ textbf {c} ross-llingual \ textbf { … 続きを読む

カテゴリー: cs.AI, cs.CL | Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs はコメントを受け付けていません

Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models

要約 大規模な言語モデル(LLM)は、バイオメディシンなどの科学分野、特に仮説生 … 続きを読む

カテゴリー: cs.AI, cs.CL | Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models はコメントを受け付けていません

Towards a Foundation Model for Communication Systems

要約 人工知能(AI)は、さまざまなドメインで前例のないパフォーマンスを実証して … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.SP | Towards a Foundation Model for Communication Systems はコメントを受け付けていません

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

要約 S1-Benchを紹介します。S1-Benchは、審議システム2の推論では … 続きを読む

カテゴリー: cs.AI, cs.CL | S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models はコメントを受け付けていません

Let LLMs Break Free from Overthinking via Self-Braking Tuning

要約 Openai O1やDeepseek-R1などの大きな推論モデル(LRMS … 続きを読む

カテゴリー: cs.AI | Let LLMs Break Free from Overthinking via Self-Braking Tuning はコメントを受け付けていません

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

要約 マシンテキスト検出器の開発においてかなりの進歩にもかかわらず、問題は本質的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It) はコメントを受け付けていません

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

要約 Satbenchを紹介します。これは、ブールの満足度(SAT)の問題から派 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas はコメントを受け付けていません

TiEBe: Tracking Language Model Recall of Notable Worldwide Events Through Time

要約 知識の状況が進化し、大規模な言語モデル(LLM)がますます広くなるにつれて … 続きを読む

カテゴリー: cs.AI, cs.CL | TiEBe: Tracking Language Model Recall of Notable Worldwide Events Through Time はコメントを受け付けていません

TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning

要約 Rehnection Learning(RL)は、報酬信号でポリシーを最適 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning はコメントを受け付けていません

Debating for Better Reasoning: An Unsupervised Multimodal Approach

要約 大規模な言語モデル(LLM)が多様なドメインとモダリティにわたって専門知識 … 続きを読む

カテゴリー: cs.AI, cs.CL | Debating for Better Reasoning: An Unsupervised Multimodal Approach はコメントを受け付けていません