月別アーカイブ: 2025年2月

A distributional simplicity bias in the learning dynamics of transformers

要約 効果的に一般化するための過剰パラメーター化されたニューラルネットワークの顕 … 続きを読む

カテゴリー: cs.CL | A distributional simplicity bias in the learning dynamics of transformers はコメントを受け付けていません

Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification

要約 テキスト分類は、データマイニングの基本的なタスクであり、表形式の理解や推奨 … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification はコメントを受け付けていません

Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation

要約 最近の生成大規模な言語モデル(LLMS)は、英語以外の言語で顕著なパフォー … 続きを読む

カテゴリー: cs.CL | Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation はコメントを受け付けていません

A Critical Look At Tokenwise Reward-Guided Text Generation

要約 大規模な言語モデル(LLMS)は、人間のフィードバック(RLHF)からのい … 続きを読む

カテゴリー: cs.CL, cs.LG | A Critical Look At Tokenwise Reward-Guided Text Generation はコメントを受け付けていません

DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders

要約 線形再発性ニューラルネットワーク(線形RNN)は、シーケンスモデリングのた … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders はコメントを受け付けていません

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

要約 現代の言語モデルは、数兆個のトークンで構成される大規模で構造化されていない … 続きを読む

カテゴリー: cs.CL | Organize the Web: Constructing Domains Enhances Pre-Training Data Curation はコメントを受け付けていません

Agentic Verification for Ambiguous Query Disambiguation

要約 この作業では、検索された世代(RAG)におけるクエリを曖昧にしているという … 続きを読む

カテゴリー: cs.CL | Agentic Verification for Ambiguous Query Disambiguation はコメントを受け付けていません

Enhancing Multilingual LLM Pretraining with Model-Based Data Selection

要約 データセットのキュレーションは、強力な大規模な言語モデル(LLM)パフォー … 続きを読む

カテゴリー: cs.CL, cs.LG | Enhancing Multilingual LLM Pretraining with Model-Based Data Selection はコメントを受け付けていません

Unknown Word Detection for English as a Second Language (ESL) Learners Using Gaze and Pre-trained Language Models

要約 第二言語(ESL)としての英語学習者は、テキストの理解を妨げる不明な単語に … 続きを読む

カテゴリー: cs.CL, cs.HC | Unknown Word Detection for English as a Second Language (ESL) Learners Using Gaze and Pre-trained Language Models はコメントを受け付けていません

Aspect-Oriented Summarization for Psychiatric Short-Term Readmission Prediction

要約 大規模な言語モデル(LLMS)の最近の進捗状況により、タスク固有のデータセ … 続きを読む

カテゴリー: cs.CL | Aspect-Oriented Summarization for Psychiatric Short-Term Readmission Prediction はコメントを受け付けていません