投稿者「jarxiv」のアーカイブ

Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model

投稿日: 2025年6月11日作成者: jarxiv

要約大規模なオーディオ言語モデル（LALMS）は、インテリジェントなヒューマン … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System

投稿日: 2025年6月11日作成者: jarxiv

要約モバイルデバイスでのタスクの実行を容易にするために、マルチモーダルの大手言 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

FROST-EMA: Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography Measurements with L1, L2 and Imitated L2 Accents

投稿日: 2025年6月11日作成者: jarxiv

要約新しい霜-EMA（フィンランド語とロシアの口頭発話データセットの電磁アーチ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

投稿日: 2025年6月11日作成者: jarxiv

要約モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

投稿日: 2025年6月11日作成者: jarxiv

要約早期の検出は、高齢者の間で一般的かつ重大な健康問題である神経認知障害（NC … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な言語モデル（LLM）エージェントは、人間の言語の理解と推論に印象的 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

投稿日: 2025年6月11日作成者: jarxiv

要約テスト駆動型開発（TDD）に基づいた新しいデータ合成フレームワークである* … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

投稿日: 2025年6月11日作成者: jarxiv

要約本研究では、XPOSシーケンスから形態系構造を識別し、それらの構造を対応す … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning to Reason Across Parallel Samples for LLM Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約テスト時間計算のスケーリングは、大規模な言語モデル（LLM）にかなりのパフ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model

Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System

FROST-EMA: Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography Measurements with L1, L2 and Imitated L2 Accents

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

Learning to Reason Across Parallel Samples for LLM Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー