月別アーカイブ: 2024年9月

Legilimens: Practical and Unified Content Moderation for Large Language Model Services

要約 大規模言語モデル (LLM) によって生成された安全でないコンテンツが社会 … 続きを読む

カテゴリー: cs.CL | Legilimens: Practical and Unified Content Moderation for Large Language Model Services はコメントを受け付けていません

Towards Evaluating and Building Versatile Large Language Models for Medicine

要約 この研究では、臨床状況における大規模言語モデル (LLM) のパフォーマン … 続きを読む

カテゴリー: cs.CL | Towards Evaluating and Building Versatile Large Language Models for Medicine はコメントを受け付けていません

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

要約 人間のフィードバックからの強化学習 (RLHF) は、言語モデルを人間の好 … 続きを読む

カテゴリー: cs.CL, cs.LG | On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization はコメントを受け付けていません

LLM-based multi-agent poetry generation in non-cooperative environments

要約 自動詩生成のための大規模言語モデル (LLM) は大幅に進歩しているにもか … 続きを読む

カテゴリー: cs.CL | LLM-based multi-agent poetry generation in non-cooperative environments はコメントを受け付けていません

The representation landscape of few-shot learning and fine-tuning in large language models

要約 インコンテキスト学習 (ICL) と教師あり微調整 (SFT) は、特定の … 続きを読む

カテゴリー: cs.CL, cs.LG | The representation landscape of few-shot learning and fine-tuning in large language models はコメントを受け付けていません

Positioning Political Texts with Large Language Models by Asking and Averaging

要約 GPT-4、Llama 3、MiXtral、Aya などの命令調整されたラ … 続きを読む

カテゴリー: cs.CL | Positioning Political Texts with Large Language Models by Asking and Averaging はコメントを受け付けていません

Exploring Group and Symmetry Principles in Large Language Models

要約 大規模言語モデル (LLM) は、幅広いアプリケーションにわたって優れたパ … 続きを読む

カテゴリー: cs.CL | Exploring Group and Symmetry Principles in Large Language Models はコメントを受け付けていません

Cost-Efficient Subjective Task Annotation and Modeling through Few-Shot Annotator Adaptation

要約 主観的な NLP タスクでは、単一のグラウンド トゥルースが存在しないため … 続きを読む

カテゴリー: cs.CL | Cost-Efficient Subjective Task Annotation and Modeling through Few-Shot Annotator Adaptation はコメントを受け付けていません

A Fused Large Language Model for Predicting Startup Success

要約 投資家はスタートアップへの収益性の高い投資機会を継続的に求めているため、効 … 続きを読む

カテゴリー: cs.CL, cs.LG | A Fused Large Language Model for Predicting Startup Success はコメントを受け付けていません

Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data?

要約 現在の最強の言語モデルの事前トレーニング データは不透明です。 特に、さま … 続きを読む

カテゴリー: cs.CL, cs.LG | Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data? はコメントを受け付けていません