「cs.CL」カテゴリーアーカイブ

GRIN: GRadient-INformed MoE

投稿日: 2024年9月19日作成者: jarxiv

要約 Mixture-of-Experts (MoE) モデルは、エキスパート … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework

投稿日: 2024年9月19日作成者: jarxiv

要約共感的な反応を生成するには、意味のある相互作用を促進するために感情的および … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning

投稿日: 2024年9月19日作成者: jarxiv

要約プロンプトによる思考連鎖 (CoT) は、大規模言語モデル (LLM) か … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

投稿日: 2024年9月19日作成者: jarxiv

要約我々は、視覚処理における従来の所定解像度アプローチを再定義する、以前の Q … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives

投稿日: 2024年9月19日作成者: jarxiv

要約この論文では、子供向けのストーリーテリングを強化するために生成人工知能 ( … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LOLA — An Open-Source Massively Multilingual Large Language Model

投稿日: 2024年9月19日作成者: jarxiv

要約この論文では、疎な専門家混合トランスフォーマーアーキテクチャを使用して … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL

投稿日: 2024年9月19日作成者: jarxiv

要約オープンドメインの text-to-SQL タスクは、大規模なデータベース … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling

投稿日: 2024年9月19日作成者: jarxiv

要約 LLM は優れたパフォーマンスを発揮しますが、幻覚に悩まされます。幻覚の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models

投稿日: 2024年9月18日作成者: jarxiv

要約現在、大規模な言語モデルの品質と機能は、自動化されたベンチマーク評価では完 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis

投稿日: 2024年9月18日作成者: jarxiv

要約大規模言語モデルの非学習は、セキュリティとプライバシーの問題に対処できる可 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

GRIN: GRadient-INformed MoE

ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework

To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives

LOLA — An Open-Source Massively Multilingual Large Language Model

MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL

Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling

Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models

Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー