投稿者「jarxiv」のアーカイブ

QwenLong-CPRS: Towards $\infty$-LLMs with Dynamic Context Optimization

要約 このテクニカルレポートは、明示的な長いコンテキスト最適化のために設計された … 続きを読む

カテゴリー: cs.CL | QwenLong-CPRS: Towards $\infty$-LLMs with Dynamic Context Optimization はコメントを受け付けていません

ManuSearch: Democratizing Deep Search in Large Language Models with a Transparent and Open Multi-Agent Framework

要約 Web熟成された大規模な言語モデル(LLM)の最近の進歩は、複雑な推論タス … 続きを読む

カテゴリー: cs.CL | ManuSearch: Democratizing Deep Search in Large Language Models with a Transparent and Open Multi-Agent Framework はコメントを受け付けていません

Watch and Listen: Understanding Audio-Visual-Speech Moments with Multimodal LLM

要約 人間は、視覚的および聴覚的な手がかりを統合することにより、ビデオの瞬間を自 … 続きを読む

カテゴリー: cs.CL | Watch and Listen: Understanding Audio-Visual-Speech Moments with Multimodal LLM はコメントを受け付けていません

HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing

要約 Hausa Natural Language Processing(NLP … 続きを読む

カテゴリー: cs.CL | HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing はコメントを受け付けていません

Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

要約 強化学習(RL)は、バイナリ検証信号を通じて自己改善を可能にすることにより … 続きを読む

カテゴリー: cs.CL, cs.LG | Bridging Supervised Learning and Reinforcement Learning in Math Reasoning はコメントを受け付けていません

UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification

要約 大規模な言語モデル(LLMS)の最近の進歩により、単一テーブルクエリのテキ … 続きを読む

カテゴリー: cs.CL | UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification はコメントを受け付けていません

TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations

要約 ディープラーニングは多くのドメインで顕著な成功を収めていますが、歴史的に表 … 続きを読む

カテゴリー: cs.CL, cs.LG | TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations はコメントを受け付けていません

Frankentext: Stitching random text fragments into long-form narratives

要約 Frankentextsを紹介します。これは、ほとんどのトークン(90%な … 続きを読む

カテゴリー: cs.CL | Frankentext: Stitching random text fragments into long-form narratives はコメントを受け付けていません

First Finish Search: Efficient Test-Time Scaling in Large Language Models

要約 テスト時間スケーリング(TTS)は、推論中の計算の動的割り当てを含む、大規 … 続きを読む

カテゴリー: cs.CL | First Finish Search: Efficient Test-Time Scaling in Large Language Models はコメントを受け付けていません

Fann or Flop: A Multigenre, Multiera Benchmark for Arabic Poetry Understanding in LLMs

要約 アラビア語の詩は、アラビア語で最も洗練された文化的に埋め込まれた表現形式の … 続きを読む

カテゴリー: cs.CL | Fann or Flop: A Multigenre, Multiera Benchmark for Arabic Poetry Understanding in LLMs はコメントを受け付けていません