月別アーカイブ: 2024年3月

Mitigating Temporal Misalignment by Discarding Outdated Facts

要約 大規模な言語モデルは、事前トレーニング中に見られる膨大な量の世界の知識を保 … 続きを読む

カテゴリー: cs.CL | Mitigating Temporal Misalignment by Discarding Outdated Facts はコメントを受け付けていません

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

要約 大規模言語モデル (LLM) は、特にジェンダーに関する社会規範と偏見を反 … 続きを読む

カテゴリー: cs.CL | Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution はコメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

要約 言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC | Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training はコメントを受け付けていません

CoGenesis: A Framework Collaborating Large and Small Language Models for Secure Context-Aware Instruction Following

要約 言語モデル (LM) の進歩に伴い、プライベート データへの露出がますます … 続きを読む

カテゴリー: cs.CL | CoGenesis: A Framework Collaborating Large and Small Language Models for Secure Context-Aware Instruction Following はコメントを受け付けていません

PETA: Parameter-Efficient Trojan Attacks

要約 パラメーター効率の良い微調整 (PEFT) により、事前トレーニングされた … 続きを読む

カテゴリー: cs.CL | PETA: Parameter-Efficient Trojan Attacks はコメントを受け付けていません

Language Guided Exploration for RL Agents in Text Environments

要約 現実世界の逐次的意思決定は、報酬がまばらで意思決定空間が大きいという特徴が … 続きを読む

カテゴリー: cs.CL | Language Guided Exploration for RL Agents in Text Environments はコメントを受け付けていません

PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset

要約 最近、大規模な言語モデルが計画を立てたり実行したりできるかどうかについて、 … 続きを読む

カテゴリー: cs.CL | PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset はコメントを受け付けていません

Towards Comprehensive Vietnamese Retrieval-Augmented Generation and Large Language Models

要約 本論文は、ベトナム語の検索補強生成(RAG)と大規模言語モデル(LLM)の … 続きを読む

カテゴリー: cs.CL | Towards Comprehensive Vietnamese Retrieval-Augmented Generation and Large Language Models はコメントを受け付けていません

MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets

要約 マルチモーダル インタラクティブ システムの開発は、LLM に大量に必要と … 続きを読む

カテゴリー: cs.CL | MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets はコメントを受け付けていません

Localized Zeroth-Order Prompt Optimization

要約 自然言語の理解と生成における大規模言語モデル (LLM) の有効性は、ブラ … 続きを読む

カテゴリー: cs.AI | Localized Zeroth-Order Prompt Optimization はコメントを受け付けていません