「cs.LG」カテゴリーアーカイブ

$FastDoc$: Domain-Specific Fast Continual Pre-training Technique using Document-Level Metadata and Taxonomy

投稿日: 2024年11月4日作成者: jarxiv

要約本論文では、$FastDoc$(Fast Continual Pre-tr … 続きを読む →

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts

投稿日: 2024年11月4日作成者: jarxiv

要約エキスパート並列は、スパースにゲートされたMoE（Mixture-of-E … 続きを読む →

カテゴリー: cs.CL, cs.DC, cs.LG | コメントを受け付けていません

Nova: A Practical and Advanced Alignment

投稿日: 2024年11月4日作成者: jarxiv

要約経験的に検証された一連の高性能モデルで採用されている、実践的なアライメント … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Leveraging Large Language Models for Suicide Detection on Social Media with Limited Labels

投稿日: 2024年11月4日作成者: jarxiv

要約自殺念慮の頻度が増加していることから、早期発見と介入の重要性が浮き彫りにな … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Large Language Models as Efficient Reward Function Searchers for Custom-Environment Multi-Objective Reinforcement Learning

投稿日: 2024年11月4日作成者: jarxiv

要約複雑なカスタム環境と複数の要求を持つ強化学習(RL)タスクにおいて、効果的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SY, eess.SY | コメントを受け付けていません

When Large Language Models Meet Vector Databases: A Survey

投稿日: 2024年11月4日作成者: jarxiv

要約この調査では、急成長しているが急速に発展している研究分野である大規模言語モ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DB, cs.LG | コメントを受け付けていません

IntraMix: Intra-Class Mixup Generation for Accurate Labels and Neighbors

投稿日: 2024年11月4日作成者: jarxiv

要約グラフ・ニューラル・ネットワーク（GNN）は、データ・ラベルから学習し、ノ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SI | コメントを受け付けていません

Equitable Federated Learning with Activation Clustering

投稿日: 2024年11月4日作成者: jarxiv

要約フェデレーテッド・ラーニングは、多様なクライアント間のコラボレーションを取 … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.SP | コメントを受け付けていません

InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling

投稿日: 2024年11月4日作成者: jarxiv

要約人間のフィードバックからの強化学習（RLHF）は、言語モデルを人間の価値観 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Long Term Memory: The Foundation of AI Self-Evolution

投稿日: 2024年11月4日作成者: jarxiv

要約 GPTのような大規模言語モデル（LLM）は、膨大なデータセットで学習され、 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

$FastDoc$: Domain-Specific Fast Continual Pre-training Technique using Document-Level Metadata and Taxonomy

Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts

Nova: A Practical and Advanced Alignment

Leveraging Large Language Models for Suicide Detection on Social Media with Limited Labels

Large Language Models as Efficient Reward Function Searchers for Custom-Environment Multi-Objective Reinforcement Learning

When Large Language Models Meet Vector Databases: A Survey

IntraMix: Intra-Class Mixup Generation for Accurate Labels and Neighbors

Equitable Federated Learning with Activation Clustering

InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling

Long Term Memory: The Foundation of AI Self-Evolution

最近の投稿

最近のコメント

アーカイブ

カテゴリー