cs.CL」カテゴリーアーカイブ

GRIN: GRadient-INformed MoE

要約 Mixture-of-Experts (MoE) モデルは、エキスパート … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GRIN: GRadient-INformed MoE はコメントを受け付けていません

ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework

要約 共感的な反応を生成するには、意味のある相互作用を促進するために感情的および … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework はコメントを受け付けていません

To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning

要約 プロンプトによる思考連鎖 (CoT) は、大規模言語モデル (LLM) か … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning はコメントを受け付けていません

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

要約 我々は、視覚処理における従来の所定解像度アプローチを再定義する、以前の Q … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution はコメントを受け付けていません

The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives

要約 この論文では、子供向けのストーリーテリングを強化するために生成人工知能 ( … 続きを読む

カテゴリー: cs.CL | The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives はコメントを受け付けていません

LOLA — An Open-Source Massively Multilingual Large Language Model

要約 この論文では、疎な専門家混合トランスフォーマー アーキテクチャを使用して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LOLA — An Open-Source Massively Multilingual Large Language Model はコメントを受け付けていません

MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL

要約 オープンドメインの text-to-SQL タスクは、大規模なデータベース … 続きを読む

カテゴリー: cs.CL | MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL はコメントを受け付けていません

Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling

要約 LLM は優れたパフォーマンスを発揮しますが、幻覚に悩まされます。 幻覚の … 続きを読む

カテゴリー: cs.AI, cs.CL | Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling はコメントを受け付けていません

Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models

要約 現在、大規模な言語モデルの品質と機能は、自動化されたベンチマーク評価では完 … 続きを読む

カテゴリー: cs.AI, cs.CL | Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models はコメントを受け付けていません

Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis

要約 大規模言語モデルの非学習は、セキュリティとプライバシーの問題に対処できる可 … 続きを読む

カテゴリー: cs.CL | Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis はコメントを受け付けていません