cs.LG」カテゴリーアーカイブ

Forecasting Smog Clouds With Deep Learning

要約 この概念実証研究では、2地点間の二酸化窒素(NO2)、オゾン(O3)、(微 … 続きを読む

カテゴリー: cs.LG | コメントする

How to Train Long-Context Language Models (Effectively)

要約 我々は、ロングコンテクスト情報を効果的に利用するための言語モデル(LM)の … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Jailbreaking LLMs with Arabic Transliteration and Arabizi

要約 本研究では、「脱獄」攻撃に対する大規模言語モデル(LLM)の潜在的な脆弱性 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Grounding Large Language Models In Embodied Environment With Imperfect World Models

要約 様々なアプリケーションで広く成功を収めているにもかかわらず、大規模言語モデ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.RO | コメントする

On Training Data Influence of GPT Models

要約 生成言語モデルの急速な進歩の中で、学習データがGPTモデルの性能をどのよう … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Training Language Models on Synthetic Edit Sequences Improves Code Synthesis

要約 ソフトウェア・エンジニアは、主に既存のプログラムを編集してコードを書く。対 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

SIEVE: General Purpose Data Filtering System Matching GPT-4o Accuracy at 1% the Cost

要約 特化した大規模言語モデルを作成するには、学習と微調整のために膨大な量のクリ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Erasing Conceptual Knowledge from Language Models

要約 言語モデルにおける概念消去は、従来、包括的な評価の枠組みを欠いていたため、 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training

要約 複数のタスクをこなすジェネラリストな具現化エージェントの学習には、主にアク … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | コメントする