cs.CL」カテゴリーアーカイブ

Representation noising can prevent harmful fine-tuning on LLMs

要約 オープンソースの大規模言語モデル (LLM) をリリースすると、悪意のある … 続きを読む

カテゴリー: cs.CL, cs.LG | Representation noising can prevent harmful fine-tuning on LLMs はコメントを受け付けていません

MedReadMe: A Systematic Study for Fine-grained Sentence Readability in Medical Domain

要約 医学書は読みにくいことで知られています。 可読性を適切に測定することは、よ … 続きを読む

カテゴリー: cs.CL | MedReadMe: A Systematic Study for Fine-grained Sentence Readability in Medical Domain はコメントを受け付けていません

LoRA vs Full Fine-tuning: An Illusion of Equivalence

要約 微調整は、事前トレーニングされた大規模な言語モデルを下流のタスクに適応させ … 続きを読む

カテゴリー: cs.CL, cs.LG | LoRA vs Full Fine-tuning: An Illusion of Equivalence はコメントを受け付けていません

Safety Arithmetic: A Framework for Test-time Safety Alignment of Language Models by Steering Parameters and Activations

要約 大規模言語モデル (LLM) は翻訳や質問応答などのアプリケーションに不可 … 続きを読む

カテゴリー: cs.CL | Safety Arithmetic: A Framework for Test-time Safety Alignment of Language Models by Steering Parameters and Activations はコメントを受け付けていません

LongReward: Improving Long-context Large Language Models with AI Feedback

要約 ロングコンテキストのラージ言語モデル (LLM) の開発では大幅な進歩が達 … 続きを読む

カテゴリー: cs.CL, cs.LG | LongReward: Improving Long-context Large Language Models with AI Feedback はコメントを受け付けていません

Are BabyLMs Second Language Learners?

要約 この論文では、2024 年版の BabyLM チャレンジに対する言語的動機 … 続きを読む

カテゴリー: cs.CL | Are BabyLMs Second Language Learners? はコメントを受け付けていません

Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics

要約 大規模言語モデル (LLM) は、堅牢な一般化可能なアルゴリズムを学習する … 続きを読む

カテゴリー: 68T5, cs.CL, I.2.7 | Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics はコメントを受け付けていません

Generating novel experimental hypotheses from language models: A case study on cross-dative generalization

要約 ニューラル ネットワーク言語モデル (LM) は、複雑な言語知識をうまく取 … 続きを読む

カテゴリー: cs.AI, cs.CL | Generating novel experimental hypotheses from language models: A case study on cross-dative generalization はコメントを受け付けていません

Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring

要約 大規模言語モデル (LLM) の安全性は重要な問題であり、モデルのセキュリ … 続きを読む

カテゴリー: cs.AI, cs.CL | Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring はコメントを受け付けていません

Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model

要約 酵素工学により、触媒活性、安定性、結合親和性、その他の特性を強化することで … 続きを読む

カテゴリー: cs.AI, cs.CL, q-bio.QM | Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model はコメントを受け付けていません