月別アーカイブ: 2024年7月

Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping

投稿日: 2024年7月16日作成者: jarxiv

要約コントラスト層によるデコード (DoLa) は、早期終了出力 (アマチュア … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment

投稿日: 2024年7月16日作成者: jarxiv

要約一般的な大規模言語モデル (LLM) を特殊なドメインに適応させるには、デ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain

投稿日: 2024年7月16日作成者: jarxiv

要約表形式データは、ディープラーニングの最後の未征服の城と考えられていますが、 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

LLM Circuit Analyses Are Consistent Across Training and Scale

投稿日: 2024年7月16日作成者: jarxiv

要約現在導入されている大規模言語モデル (LLM) のほとんどは、継続的なトレ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Learning to Generate Answers with Citations via Factual Consistency Models

投稿日: 2024年7月16日作成者: jarxiv

要約大規模言語モデル (LLM) は頻繁に幻覚を起こし、ミッションクリティカル … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning from Naturally Occurring Feedback

投稿日: 2024年7月16日作成者: jarxiv

要約人間のフィードバックデータは、言語モデルの開発において重要なコンポーネン … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Representing Rule-based Chatbots with Transformers

投稿日: 2024年7月16日作成者: jarxiv

要約 Transformer ベースのチャットボットは流暢で自然な会話を行うこと … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models

投稿日: 2024年7月16日作成者: jarxiv

要約相互強化効果 (MRE) は、情報抽出とマルチタスク研究における有望な手段 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

投稿日: 2024年7月16日作成者: jarxiv

要約私たちは、まばらにアクティブ化された大規模言語モデル (LLM) をトレー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Large Language Models and Games: A Survey and Roadmap

投稿日: 2024年7月16日作成者: jarxiv

要約近年、大規模言語モデル (LLM) に関する研究が爆発的に増加し、それに伴 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC | コメントを受け付けていません

月別アーカイブ: 2024年7月

Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping

Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment

Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain

LLM Circuit Analyses Are Consistent Across Training and Scale

Learning to Generate Answers with Citations via Factual Consistency Models

Learning from Naturally Occurring Feedback

Representing Rule-based Chatbots with Transformers

MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Large Language Models and Games: A Survey and Roadmap

最近の投稿

最近のコメント

アーカイブ

カテゴリー