「cs.CL」カテゴリーアーカイブ

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

投稿日: 2025年6月11日作成者: jarxiv

要約モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

投稿日: 2025年6月11日作成者: jarxiv

要約早期の検出は、高齢者の間で一般的かつ重大な健康問題である神経認知障害（NC … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な言語モデル（LLM）エージェントは、人間の言語の理解と推論に印象的 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

投稿日: 2025年6月11日作成者: jarxiv

要約テスト駆動型開発（TDD）に基づいた新しいデータ合成フレームワークである* … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

投稿日: 2025年6月11日作成者: jarxiv

要約本研究では、XPOSシーケンスから形態系構造を識別し、それらの構造を対応す … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning to Reason Across Parallel Samples for LLM Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約テスト時間計算のスケーリングは、大規模な言語モデル（LLM）にかなりのパフ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features

投稿日: 2025年6月11日作成者: jarxiv

要約この研究では、同一の第二言語文書の全体的な把握を改善することを目的とした人 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

投稿日: 2025年6月11日作成者: jarxiv

要約テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs

投稿日: 2025年6月11日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、視覚入力に関す … 続きを読む →

カテゴリー: 68T5, cs.CL, I.2.7 | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

Learning to Reason Across Parallel Samples for LLM Reasoning

Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー