cs.CL」カテゴリーアーカイブ

SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models

要約 大規模言語モデル (LLM) は成功を収めていますが、依然として高い推論コ … 続きを読む

カテゴリー: cs.CL | SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models はコメントを受け付けていません

StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization

要約 検索拡張生成 (RAG) は、多くの知識ベースのタスクにおいて大規模言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL | StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization はコメントを受け付けていません

Detection of Human and Machine-Authored Fake News in Urdu

要約 ソーシャルメディアの台頭によりフェイクニュースの拡散が増幅され、現在ではC … 続きを読む

カテゴリー: cs.CL, cs.LG | Detection of Human and Machine-Authored Fake News in Urdu はコメントを受け付けていません

Large Language Models Still Exhibit Bias in Long Text

要約 大規模言語モデル (LLM) の既存の公平性ベンチマークは、主に多肢選択式 … 続きを読む

カテゴリー: cs.CL | Large Language Models Still Exhibit Bias in Long Text はコメントを受け付けていません

Mirror Matrix on the Wall: coding and vector notation as tools for introspection

要約 GNU Octave によって採用されたベクトル表記は、Kenneth E … 続きを読む

カテゴリー: cs.CL, cs.SE | Mirror Matrix on the Wall: coding and vector notation as tools for introspection はコメントを受け付けていません

On the Robustness of Editing Large Language Models

要約 大規模言語モデル (LLM) は、コミュニケーション型 AI の構築におい … 続きを読む

カテゴリー: cs.CL | On the Robustness of Editing Large Language Models はコメントを受け付けていません

ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems

要約 大規模言語モデル (LLM) を使用する検索拡張生成 (RAG) システム … 続きを読む

カテゴリー: cs.CL | ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems はコメントを受け付けていません

Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering

要約 大規模言語モデル (LLM) は、パラメーターに大量の事実の知識を保存でき … 続きを読む

カテゴリー: cs.CL | Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering はコメントを受け付けていません

A distributional simplicity bias in the learning dynamics of transformers

要約 過剰パラメータ化されたニューラル ネットワークが効果的に一般化する驚くべき … 続きを読む

カテゴリー: cs.CL | A distributional simplicity bias in the learning dynamics of transformers はコメントを受け付けていません

Demonstration-based learning for few-shot biomedical named entity recognition under machine reading comprehension

要約 深層学習技術は大きな成果を上げていますが、手動でラベル付けされた大量のデー … 続きを読む

カテゴリー: cs.CL | Demonstration-based learning for few-shot biomedical named entity recognition under machine reading comprehension はコメントを受け付けていません