「cs.CL」カテゴリーアーカイブ

Representation noising can prevent harmful fine-tuning on LLMs

投稿日: 2024年10月29日作成者: jarxiv

要約オープンソースの大規模言語モデル (LLM) をリリースすると、悪意のある … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MedReadMe: A Systematic Study for Fine-grained Sentence Readability in Medical Domain

投稿日: 2024年10月29日作成者: jarxiv

要約医学書は読みにくいことで知られています。可読性を適切に測定することは、よ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LoRA vs Full Fine-tuning: An Illusion of Equivalence

投稿日: 2024年10月29日作成者: jarxiv

要約微調整は、事前トレーニングされた大規模な言語モデルを下流のタスクに適応させ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Safety Arithmetic: A Framework for Test-time Safety Alignment of Language Models by Steering Parameters and Activations

投稿日: 2024年10月29日作成者: jarxiv

要約大規模言語モデル (LLM) は翻訳や質問応答などのアプリケーションに不可 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LongReward: Improving Long-context Large Language Models with AI Feedback

投稿日: 2024年10月29日作成者: jarxiv

要約ロングコンテキストのラージ言語モデル (LLM) の開発では大幅な進歩が達 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Are BabyLMs Second Language Learners?

投稿日: 2024年10月29日作成者: jarxiv

要約この論文では、2024 年版の BabyLM チャレンジに対する言語的動機 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics

投稿日: 2024年10月29日作成者: jarxiv

要約大規模言語モデル (LLM) は、堅牢な一般化可能なアルゴリズムを学習する … 続きを読む →

カテゴリー: 68T5, cs.CL, I.2.7 | コメントを受け付けていません

Generating novel experimental hypotheses from language models: A case study on cross-dative generalization

投稿日: 2024年10月29日作成者: jarxiv

要約ニューラルネットワーク言語モデル (LM) は、複雑な言語知識をうまく取 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring

投稿日: 2024年10月29日作成者: jarxiv

要約大規模言語モデル (LLM) の安全性は重要な問題であり、モデルのセキュリ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model

投稿日: 2024年10月29日作成者: jarxiv

要約酵素工学により、触媒活性、安定性、結合親和性、その他の特性を強化することで … 続きを読む →

カテゴリー: cs.AI, cs.CL, q-bio.QM | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Representation noising can prevent harmful fine-tuning on LLMs

MedReadMe: A Systematic Study for Fine-grained Sentence Readability in Medical Domain

LoRA vs Full Fine-tuning: An Illusion of Equivalence

Safety Arithmetic: A Framework for Test-time Safety Alignment of Language Models by Steering Parameters and Activations

LongReward: Improving Long-context Large Language Models with AI Feedback

Are BabyLMs Second Language Learners?

Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics

Generating novel experimental hypotheses from language models: A case study on cross-dative generalization

Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring

Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー