月別アーカイブ: 2025年5月

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

投稿日: 2025年5月30日作成者: jarxiv

要約言語モデル（LMS）は、標準化されたコーディングベンチマークでうまく機能し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation

投稿日: 2025年5月30日作成者: jarxiv

要約 Exitを導入します。Exitは、質問回答（QA）で検索された生成（RAG … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

Table-R1: Inference-Time Scaling for Table Reasoning

投稿日: 2025年5月30日作成者: jarxiv

要約この作業では、テーブル推論タスクの推論時間スケーリングを調査する最初の研究 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Characterizing the Expressivity of Transformer Language Models

投稿日: 2025年5月30日作成者: jarxiv

要約トランスベースの言語モデル（LMS）は、広範な経験的成功を達成していますが … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning

投稿日: 2025年5月30日作成者: jarxiv

要約正式なロジックにより、コンピューターは象徴的な形式で文を表すことにより、コ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

GeNRe: A French Gender-Neutral Rewriting System Using Collective Nouns

投稿日: 2025年5月30日作成者: jarxiv

要約自然言語処理の分野（NLP）で使用されるテキストデータのかなりの部分は、特 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Are Reasoning Models More Prone to Hallucination?

投稿日: 2025年5月30日作成者: jarxiv

要約最近進化した大規模な推論モデル（LRMS）は、長い考え方（COT）の推論能 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Small Language Models: Architectures, Techniques, Evaluation, Problems and Future Adaptation

投稿日: 2025年5月30日作成者: jarxiv

要約小言語モデル（SLM）は、より少ないコンピューターリソースを使用しながら、 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ARC: Argument Representation and Coverage Analysis for Zero-Shot Long Document Summarization with Instruction Following LLMs

投稿日: 2025年5月30日作成者: jarxiv

要約構造化された情報を統合することで、特に顕著なコンテンツの保持において、抽象 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ToolHaystack: Stress-Testing Tool-Augmented Language Models in Realistic Long-Term Interactions

投稿日: 2025年5月30日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、外部ツールを使用してユーザーの問い合わせ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2025年5月

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation

Table-R1: Inference-Time Scaling for Table Reasoning

Characterizing the Expressivity of Transformer Language Models

RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning

GeNRe: A French Gender-Neutral Rewriting System Using Collective Nouns

Are Reasoning Models More Prone to Hallucination?

Small Language Models: Architectures, Techniques, Evaluation, Problems and Future Adaptation

ARC: Argument Representation and Coverage Analysis for Zero-Shot Long Document Summarization with Instruction Following LLMs

ToolHaystack: Stress-Testing Tool-Augmented Language Models in Realistic Long-Term Interactions

最近の投稿

最近のコメント

アーカイブ

カテゴリー