「cs.CL」カテゴリーアーカイブ

Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges

投稿日: 2024年3月6日作成者: jarxiv

要約急速に進化する機械学習 (ML) の分野では、データ拡張 (DA) が、追 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models

投稿日: 2024年3月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、一般的に使用される Transforme … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

The Case for Evaluating Multimodal Translation Models on Text Datasets

投稿日: 2024年3月6日作成者: jarxiv

要約優れた評価フレームワークでは、1) 翻訳タスクを支援する視覚情報の使用、2 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Socratic Reasoning Improves Positive Text Rewriting

投稿日: 2024年3月6日作成者: jarxiv

要約ネガティブな思考をポジティブな思考に再構成することは、メンタルヘルスや心理 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning to Use Tools via Cooperative and Interactive Agents

投稿日: 2024年3月6日作成者: jarxiv

要約ツール学習により、大規模言語モデル (LLM) がエージェントとして外部ツ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Adding Multimodal Capabilities to a Text-only Translation Model

投稿日: 2024年3月6日作成者: jarxiv

要約マルチモーダル機械翻訳 (MMT) の最新の研究では、トレーニングと評価に … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Detecting Concrete Visual Tokens for Multimodal Machine Translation

投稿日: 2024年3月6日作成者: jarxiv

要約マルチモーダル機械翻訳 (MMT) システムにおける視覚的な根拠とマスキン … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mitigating Temporal Misalignment by Discarding Outdated Facts

投稿日: 2024年3月6日作成者: jarxiv

要約大規模な言語モデルは、事前トレーニング中に見られる膨大な量の世界の知識を保 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

投稿日: 2024年3月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、特にジェンダーに関する社会規範と偏見を反 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

投稿日: 2024年3月6日作成者: jarxiv

要約言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む →

カテゴリー: cs.CL, cs.LG, math.OC | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges

DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models

The Case for Evaluating Multimodal Translation Models on Text Datasets

Socratic Reasoning Improves Positive Text Rewriting

Learning to Use Tools via Cooperative and Interactive Agents

Adding Multimodal Capabilities to a Text-only Translation Model

Detecting Concrete Visual Tokens for Multimodal Machine Translation

Mitigating Temporal Misalignment by Discarding Outdated Facts

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

最近の投稿

最近のコメント

アーカイブ

カテゴリー