月別アーカイブ: 2025年6月

Do Large Language Models Judge Error Severity Like Humans?

要約 大規模な言語モデル(LLM)は、自然言語生成の自動評価者としてますます使用 … 続きを読む

カテゴリー: cs.CL | コメントする

CIVET: Systematic Evaluation of Understanding in VLMs

要約 ビジョン言語モデル(VLM)はさまざまなタスクで競争力のあるパフォーマンス … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

ValueSim: Generating Backstories to Model Individual Value Systems

要約 大規模な言語モデル(LLM)はますます人間のような能力を示し続けているため … 続きを読む

カテゴリー: cs.CL | コメントする

Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models

要約 この作業では、QWEN3 Foundationモデルに基づいて構築されたテ … 続きを読む

カテゴリー: cs.CL | コメントする

RELIC: Evaluating Compositional Instruction Following via Language Recognition

要約 大規模な言語モデル(LLM)は、入力や出力の例なしで、コンテキストで提供さ … 続きを読む

カテゴリー: cs.CL | コメントする

MMBoundary: Advancing MLLM Knowledge Boundary Awareness through Reasoning Step Confidence Calibration

要約 近年、マルチモーダルの大手言語モデル(MLLM)は大きな進歩を遂げています … 続きを読む

カテゴリー: cs.CL | コメントする

The Common Pile v0.1: An 8TB Dataset of Public Domain and Openly Licensed Text

要約 大規模な言語モデル(LLM)は、通常、膨大な量の免許のないテキストで訓練さ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Improving Low-Resource Morphological Inflection via Self-Supervised Objectives

要約 自己教師の目的は、大規模な非標識データを活用することにより、NLPの大きな … 続きを読む

カテゴリー: cs.CL | コメントする

Diagonal Batching Unlocks Parallelism in Recurrent Memory Transformers for Long Contexts

要約 トランスモデルは、二次時間と線形メモリの複雑さのために、長いコンテキスト推 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Towards a Unified System of Representation for Continuity and Discontinuity in Natural Language

要約 構文の不連続性は、構成要素の一部ではない要素を挿入するため、構成要素が複数 … 続きを読む

カテゴリー: cs.CL | コメントする