投稿者「jarxiv」のアーカイブ

Long-context Non-factoid Question Answering in Indic Languages

要約 特定のコンテキストから回答を抽出することを含む質問回答(QA)タスクは、コ … 続きを読む

カテゴリー: cs.CL | Long-context Non-factoid Question Answering in Indic Languages はコメントを受け付けていません

Beyond Homogeneous Attention: Memory-Efficient LLMs via Fourier-Approximated KV Cache

要約 大規模な言語モデルは、コンテキストの長さが増加するにつれて、成長するキー価 … 続きを読む

カテゴリー: cs.CL | Beyond Homogeneous Attention: Memory-Efficient LLMs via Fourier-Approximated KV Cache はコメントを受け付けていません

TreeRL: LLM Reinforcement Learning with On-Policy Tree Search

要約 ツリー検索を備えた強化学習(RL)は、従来の推論タスクで優れたパフォーマン … 続きを読む

カテゴリー: cs.CL, cs.LG | TreeRL: LLM Reinforcement Learning with On-Policy Tree Search はコメントを受け付けていません

GeistBERT: Breathing Life into German NLP

要約 トランスベースの言語モデルの進歩は、高品質のコーパスでの言語固有の事前トレ … 続きを読む

カテゴリー: cs.CL | GeistBERT: Breathing Life into German NLP はコメントを受け付けていません

Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study

要約 カウンタースピーチ(CS)は、オンラインヘイトスピーチ(HS)を緩和するた … 続きを読む

カテゴリー: cs.CL | Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study はコメントを受け付けていません

T1: Advancing Language Model Reasoning through Reinforcement Learning and Inference Scaling

要約 大規模な言語モデル(LLMS)は、複雑な推論タスクにおいて顕著な能力を示し … 続きを読む

カテゴリー: cs.CL, cs.LG | T1: Advancing Language Model Reasoning through Reinforcement Learning and Inference Scaling はコメントを受け付けていません

Feedback Friction: LLMs Struggle to Fully Incorporate External Feedback

要約 最近の研究では、LLMが外部フィードバックを与えられたときに応答を改善する … 続きを読む

カテゴリー: cs.CL | Feedback Friction: LLMs Struggle to Fully Incorporate External Feedback はコメントを受け付けていません

Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations

要約 このペーパーでは、実際の知識の中で、時間的文脈の変動に対する言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations はコメントを受け付けていません

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

要約 テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む

カテゴリー: cs.CL, cs.LG | e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs はコメントを受け付けていません

Generative Representational Learning of Foundation Models for Recommendation

要約 多様なタスクを越えて優れた能力を備えた単一の基礎モデルを開発することは、人 … 続きを読む

カテゴリー: cs.CL, cs.IR | Generative Representational Learning of Foundation Models for Recommendation はコメントを受け付けていません