cs.CL」カテゴリーアーカイブ

Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges

要約 急速に進化する機械学習 (ML) の分野では、データ拡張 (DA) が、追 … 続きを読む

カテゴリー: cs.AI, cs.CL | Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges はコメントを受け付けていません

DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models

要約 大規模言語モデル (LLM) は、一般的に使用される Transforme … 続きを読む

カテゴリー: cs.CL, cs.LG | DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models はコメントを受け付けていません

The Case for Evaluating Multimodal Translation Models on Text Datasets

要約 優れた評価フレームワークでは、1) 翻訳タスクを支援する視覚情報の使用、2 … 続きを読む

カテゴリー: cs.CL | The Case for Evaluating Multimodal Translation Models on Text Datasets はコメントを受け付けていません

Socratic Reasoning Improves Positive Text Rewriting

要約 ネガティブな思考をポジティブな思考に再構成することは、メンタルヘルスや心理 … 続きを読む

カテゴリー: cs.CL | Socratic Reasoning Improves Positive Text Rewriting はコメントを受け付けていません

Learning to Use Tools via Cooperative and Interactive Agents

要約 ツール学習により、大規模言語モデル (LLM) がエージェントとして外部ツ … 続きを読む

カテゴリー: cs.CL | Learning to Use Tools via Cooperative and Interactive Agents はコメントを受け付けていません

Adding Multimodal Capabilities to a Text-only Translation Model

要約 マルチモーダル機械翻訳 (MMT) の最新の研究では、トレーニングと評価に … 続きを読む

カテゴリー: cs.CL | Adding Multimodal Capabilities to a Text-only Translation Model はコメントを受け付けていません

Detecting Concrete Visual Tokens for Multimodal Machine Translation

要約 マルチモーダル機械翻訳 (MMT) システムにおける視覚的な根拠とマスキン … 続きを読む

カテゴリー: cs.CL | Detecting Concrete Visual Tokens for Multimodal Machine Translation はコメントを受け付けていません

Mitigating Temporal Misalignment by Discarding Outdated Facts

要約 大規模な言語モデルは、事前トレーニング中に見られる膨大な量の世界の知識を保 … 続きを読む

カテゴリー: cs.CL | Mitigating Temporal Misalignment by Discarding Outdated Facts はコメントを受け付けていません

Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution

要約 大規模言語モデル (LLM) は、特にジェンダーに関する社会規範と偏見を反 … 続きを読む

カテゴリー: cs.CL | Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution はコメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

要約 言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC | Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training はコメントを受け付けていません