月別アーカイブ: 2024年2月

CroissantLLM: A Truly Bilingual French-English Language Model

要約 私たちは、3T 英語とフランス語のトークンのセットで事前トレーニングされた … 続きを読む

カテゴリー: cs.CL, cs.LG | CroissantLLM: A Truly Bilingual French-English Language Model はコメントを受け付けていません

Leveraging Open Information Extraction for More Robust Domain Transfer of Event Trigger Detection

要約 イベント検出は、Wikipedia やニュースなどの多くの分野で重要な情報 … 続きを読む

カテゴリー: cs.CL, cs.LG | Leveraging Open Information Extraction for More Robust Domain Transfer of Event Trigger Detection はコメントを受け付けていません

Stars Are All You Need: A Distantly Supervised Pyramid Network for Unified Sentiment Analysis

要約 星のレビューなど、評価予測 (RP) センチメント分析タスクのデータはすぐ … 続きを読む

カテゴリー: cs.CL | Stars Are All You Need: A Distantly Supervised Pyramid Network for Unified Sentiment Analysis はコメントを受け付けていません

Engineering A Large Language Model From Scratch

要約 自然言語処理 (NLP) における深層学習の普及により、驚くべき熟練度で人 … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG, cs.SE, I.2.7 | Engineering A Large Language Model From Scratch はコメントを受け付けていません

OLMo: Accelerating the Science of Language Models

要約 言語モデル (LM) は、NLP 研究と商用製品の両方で広く普及しています … 続きを読む

カテゴリー: cs.CL | OLMo: Accelerating the Science of Language Models はコメントを受け付けていません

Tiny Titans: Can Smaller Large Language Models Punch Above Their Weight in the Real World for Meeting Summarization?

要約 大規模言語モデル (LLM) は、タスク固有のデータセットで明示的に微調整 … 続きを読む

カテゴリー: cs.CL | Tiny Titans: Can Smaller Large Language Models Punch Above Their Weight in the Real World for Meeting Summarization? はコメントを受け付けていません

Towards Efficient and Exact Optimization of Language Model Alignment

要約 言語モデルを人間の好みに合わせることは、現実世界のタスクに言語モデルを適用 … 続きを読む

カテゴリー: cs.CL | Towards Efficient and Exact Optimization of Language Model Alignment はコメントを受け付けていません

Can Large Language Models Understand Context?

要約 コンテキストを理解することは人間の言語を理解するための鍵であり、大規模言語 … 続きを読む

カテゴリー: cs.CL | Can Large Language Models Understand Context? はコメントを受け付けていません

ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning

要約 表現力豊かなシーケンス モデリング技術を使用してアクション生成を実行する … 続きを読む

カテゴリー: cs.AI, cs.LG | ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning はコメントを受け付けていません

BrainSLAM: SLAM on Neural Population Activity Data

要約 同時位置特定およびマッピング (SLAM) アルゴリズムは、新しい環境の地 … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO | BrainSLAM: SLAM on Neural Population Activity Data はコメントを受け付けていません