投稿者「jarxiv」のアーカイブ

Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model

要約 大規模なオーディオ言語モデル(LALMS)は、インテリジェントなヒューマン … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model はコメントを受け付けていません

Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System

要約 モバイルデバイスでのタスクの実行を容易にするために、マルチモーダルの大手言 … 続きを読む

カテゴリー: cs.CL | Atomic-to-Compositional Generalization for Mobile Agents with A New Benchmark and Scheduling System はコメントを受け付けていません

FROST-EMA: Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography Measurements with L1, L2 and Imitated L2 Accents

要約 新しい霜-EMA(フィンランド語とロシアの口頭発話データセットの電磁アーチ … 続きを読む

カテゴリー: cs.CL | FROST-EMA: Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography Measurements with L1, L2 and Imitated L2 Accents はコメントを受け付けていません

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

要約 モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips はコメントを受け付けていません

Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder

要約 早期の検出は、高齢者の間で一般的かつ重大な健康問題である神経認知障害(NC … 続きを読む

カテゴリー: cs.CL | Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder はコメントを受け付けていません

DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments

要約 大規模な言語モデル(LLM)エージェントは、人間の言語の理解と推論に印象的 … 続きを読む

カテゴリー: cs.CL | DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments はコメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

要約 検証可能な報酬(RLVR)による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む

カテゴリー: cs.CL, cs.LG | SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning はコメントを受け付けていません

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

要約 テスト駆動型開発(TDD)に基づいた新しいデータ合成フレームワークである* … 続きを読む

カテゴリー: cs.CL | SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner はコメントを受け付けていません

UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags

要約 本研究では、XPOSシーケンスから形態系構造を識別し、それらの構造を対応す … 続きを読む

カテゴリー: cs.CL | UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags はコメントを受け付けていません

Learning to Reason Across Parallel Samples for LLM Reasoning

要約 テスト時間計算のスケーリングは、大規模な言語モデル(LLM)にかなりのパフ … 続きを読む

カテゴリー: cs.CL | Learning to Reason Across Parallel Samples for LLM Reasoning はコメントを受け付けていません