月別アーカイブ: 2024年2月

CroissantLLM: A Truly Bilingual French-English Language Model

投稿日: 2024年2月2日作成者: jarxiv

要約私たちは、3T 英語とフランス語のトークンのセットで事前トレーニングされた … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Leveraging Open Information Extraction for More Robust Domain Transfer of Event Trigger Detection

投稿日: 2024年2月2日作成者: jarxiv

要約イベント検出は、Wikipedia やニュースなどの多くの分野で重要な情報 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Stars Are All You Need: A Distantly Supervised Pyramid Network for Unified Sentiment Analysis

投稿日: 2024年2月2日作成者: jarxiv

要約星のレビューなど、評価予測 (RP) センチメント分析タスクのデータはすぐ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Engineering A Large Language Model From Scratch

投稿日: 2024年2月2日作成者: jarxiv

要約自然言語処理 (NLP) における深層学習の普及により、驚くべき熟練度で人 … 続きを読む →

カテゴリー: cs.CL, cs.CY, cs.LG, cs.SE, I.2.7 | コメントを受け付けていません

OLMo: Accelerating the Science of Language Models

投稿日: 2024年2月2日作成者: jarxiv

要約言語モデル (LM) は、NLP 研究と商用製品の両方で広く普及しています … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Tiny Titans: Can Smaller Large Language Models Punch Above Their Weight in the Real World for Meeting Summarization?

投稿日: 2024年2月2日作成者: jarxiv

要約大規模言語モデル (LLM) は、タスク固有のデータセットで明示的に微調整 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Towards Efficient and Exact Optimization of Language Model Alignment

投稿日: 2024年2月2日作成者: jarxiv

要約言語モデルを人間の好みに合わせることは、現実世界のタスクに言語モデルを適用 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Can Large Language Models Understand Context?

投稿日: 2024年2月2日作成者: jarxiv

要約コンテキストを理解することは人間の言語を理解するための鍵であり、大規模言語 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning

投稿日: 2024年2月2日作成者: jarxiv

要約表現力豊かなシーケンスモデリング技術を使用してアクション生成を実行する … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

BrainSLAM: SLAM on Neural Population Activity Data

投稿日: 2024年2月2日作成者: jarxiv

要約同時位置特定およびマッピング (SLAM) アルゴリズムは、新しい環境の地 … 続きを読む →

カテゴリー: cs.AI, cs.MA, cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年2月

CroissantLLM: A Truly Bilingual French-English Language Model

Leveraging Open Information Extraction for More Robust Domain Transfer of Event Trigger Detection

Stars Are All You Need: A Distantly Supervised Pyramid Network for Unified Sentiment Analysis

Engineering A Large Language Model From Scratch

OLMo: Accelerating the Science of Language Models

Tiny Titans: Can Smaller Large Language Models Punch Above Their Weight in the Real World for Meeting Summarization?

Towards Efficient and Exact Optimization of Language Model Alignment

Can Large Language Models Understand Context?

ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning

BrainSLAM: SLAM on Neural Population Activity Data

最近の投稿

最近のコメント

アーカイブ

カテゴリー