月別アーカイブ: 2025年5月

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

要約 言語モデル(LMS)は、標準化されたコーディングベンチマークでうまく機能し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | コメントする

EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation

要約 Exitを導入します。Exitは、質問回答(QA)で検索された生成(RAG … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | コメントする

Table-R1: Inference-Time Scaling for Table Reasoning

要約 この作業では、テーブル推論タスクの推論時間スケーリングを調査する最初の研究 … 続きを読む

カテゴリー: cs.CL | コメントする

Characterizing the Expressivity of Transformer Language Models

要約 トランスベースの言語モデル(LMS)は、広範な経験的成功を達成していますが … 続きを読む

カテゴリー: cs.CL | コメントする

RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning

要約 正式なロジックにより、コンピューターは象徴的な形式で文を表すことにより、コ … 続きを読む

カテゴリー: cs.CL | コメントする

GeNRe: A French Gender-Neutral Rewriting System Using Collective Nouns

要約 自然言語処理の分野(NLP)で使用されるテキストデータのかなりの部分は、特 … 続きを読む

カテゴリー: cs.CL | コメントする

Are Reasoning Models More Prone to Hallucination?

要約 最近進化した大規模な推論モデル(LRMS)は、長い考え方(COT)の推論能 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Small Language Models: Architectures, Techniques, Evaluation, Problems and Future Adaptation

要約 小言語モデル(SLM)は、より少ないコンピューターリソースを使用しながら、 … 続きを読む

カテゴリー: cs.CL | コメントする

ARC: Argument Representation and Coverage Analysis for Zero-Shot Long Document Summarization with Instruction Following LLMs

要約 構造化された情報を統合することで、特に顕著なコンテンツの保持において、抽象 … 続きを読む

カテゴリー: cs.CL | コメントする

ToolHaystack: Stress-Testing Tool-Augmented Language Models in Realistic Long-Term Interactions

要約 大規模な言語モデル(LLMS)は、外部ツールを使用してユーザーの問い合わせ … 続きを読む

カテゴリー: cs.CL | コメントする