月別アーカイブ: 2024年3月

Mitigating Temporal Misalignment by Discarding Outdated Facts

投稿日: 2024年3月6日作成者: jarxiv

要約大規模な言語モデルは、事前トレーニング中に見られる膨大な量の世界の知識を保 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

投稿日: 2024年3月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、特にジェンダーに関する社会規範と偏見を反 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

投稿日: 2024年3月6日作成者: jarxiv

要約言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む →

カテゴリー: cs.CL, cs.LG, math.OC | コメントを受け付けていません

CoGenesis: A Framework Collaborating Large and Small Language Models for Secure Context-Aware Instruction Following

投稿日: 2024年3月6日作成者: jarxiv

要約言語モデル (LM) の進歩に伴い、プライベートデータへの露出がますます … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PETA: Parameter-Efficient Trojan Attacks

投稿日: 2024年3月6日作成者: jarxiv

要約パラメーター効率の良い微調整 (PEFT) により、事前トレーニングされた … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Language Guided Exploration for RL Agents in Text Environments

投稿日: 2024年3月6日作成者: jarxiv

要約現実世界の逐次的意思決定は、報酬がまばらで意思決定空間が大きいという特徴が … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset

投稿日: 2024年3月6日作成者: jarxiv

要約最近、大規模な言語モデルが計画を立てたり実行したりできるかどうかについて、 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Towards Comprehensive Vietnamese Retrieval-Augmented Generation and Large Language Models

投稿日: 2024年3月6日作成者: jarxiv

要約本論文は、ベトナム語の検索補強生成（RAG）と大規模言語モデル（LLM）の … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets

投稿日: 2024年3月6日作成者: jarxiv

要約マルチモーダルインタラクティブシステムの開発は、LLM に大量に必要と … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Localized Zeroth-Order Prompt Optimization

投稿日: 2024年3月6日作成者: jarxiv

要約自然言語の理解と生成における大規模言語モデル (LLM) の有効性は、ブラ … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

月別アーカイブ: 2024年3月

Mitigating Temporal Misalignment by Discarding Outdated Facts

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

CoGenesis: A Framework Collaborating Large and Small Language Models for Secure Context-Aware Instruction Following

PETA: Parameter-Efficient Trojan Attacks

Language Guided Exploration for RL Agents in Text Environments

PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset

Towards Comprehensive Vietnamese Retrieval-Augmented Generation and Large Language Models

MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets

Localized Zeroth-Order Prompt Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー