cs.CL」カテゴリーアーカイブ

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

要約 モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips はコメントを受け付けていません

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

要約 早期の検出は、高齢者の間で一般的かつ重大な健康問題である神経認知障害(NC … 続きを読む

カテゴリー: cs.CL | Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder はコメントを受け付けていません

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

要約 大規模な言語モデル(LLM)エージェントは、人間の言語の理解と推論に印象的 … 続きを読む

カテゴリー: cs.CL | DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments はコメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

要約 検証可能な報酬(RLVR)による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む

カテゴリー: cs.CL, cs.LG | SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning はコメントを受け付けていません

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

要約 テスト駆動型開発(TDD)に基づいた新しいデータ合成フレームワークである* … 続きを読む

カテゴリー: cs.CL | SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner はコメントを受け付けていません

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

要約 本研究では、XPOSシーケンスから形態系構造を識別し、それらの構造を対応す … 続きを読む

カテゴリー: cs.CL | UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags はコメントを受け付けていません

Learning to Reason Across Parallel Samples for LLM Reasoning

要約 テスト時間計算のスケーリングは、大規模な言語モデル(LLM)にかなりのパフ … 続きを読む

カテゴリー: cs.CL | Learning to Reason Across Parallel Samples for LLM Reasoning はコメントを受け付けていません

Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features

要約 この研究では、同一の第二言語文書の全体的な把握を改善することを目的とした人 … 続きを読む

カテゴリー: cs.CL | Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features はコメントを受け付けていません

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

要約 テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む

カテゴリー: cs.CL, cs.LG | e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs はコメントを受け付けていません

Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs

要約 Vision-Language Models(VLMS)は、視覚入力に関す … 続きを読む

カテゴリー: 68T5, cs.CL, I.2.7 | Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs はコメントを受け付けていません