月別アーカイブ: 2024年7月

Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping

要約 コントラスト層によるデコード (DoLa) は、早期終了出力 (アマチュア … 続きを読む

カテゴリー: cs.CL | Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping はコメントを受け付けていません

Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment

要約 一般的な大規模言語モデル (LLM) を特殊なドメインに適応させるには、デ … 続きを読む

カテゴリー: cs.CL | Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment はコメントを受け付けていません

Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain

要約 表形式データは、ディープラーニングの最後の未征服の城と考えられていますが、 … 続きを読む

カテゴリー: cs.CL, cs.LG | Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain はコメントを受け付けていません

LLM Circuit Analyses Are Consistent Across Training and Scale

要約 現在導入されている大規模言語モデル (LLM) のほとんどは、継続的なトレ … 続きを読む

カテゴリー: cs.CL, cs.LG | LLM Circuit Analyses Are Consistent Across Training and Scale はコメントを受け付けていません

Learning to Generate Answers with Citations via Factual Consistency Models

要約 大規模言語モデル (LLM) は頻繁に幻覚を起こし、ミッションクリティカル … 続きを読む

カテゴリー: cs.CL | Learning to Generate Answers with Citations via Factual Consistency Models はコメントを受け付けていません

Learning from Naturally Occurring Feedback

要約 人間のフィードバック データは、言語モデルの開発において重要なコンポーネン … 続きを読む

カテゴリー: cs.CL | Learning from Naturally Occurring Feedback はコメントを受け付けていません

Representing Rule-based Chatbots with Transformers

要約 Transformer ベースのチャットボットは流暢で自然な会話を行うこと … 続きを読む

カテゴリー: cs.CL, cs.LG | Representing Rule-based Chatbots with Transformers はコメントを受け付けていません

MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models

要約 相互強化効果 (MRE) は、情報抽出とマルチタスク研究における有望な手段 … 続きを読む

カテゴリー: cs.CL | MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models はコメントを受け付けていません

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

要約 私たちは、まばらにアクティブ化された大規模言語モデル (LLM) をトレー … 続きを読む

カテゴリー: cs.CL, cs.LG | Q-Sparse: All Large Language Models can be Fully Sparsely-Activated はコメントを受け付けていません

Large Language Models and Games: A Survey and Roadmap

要約 近年、大規模言語モデル (LLM) に関する研究が爆発的に増加し、それに伴 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | Large Language Models and Games: A Survey and Roadmap はコメントを受け付けていません