月別アーカイブ: 2024年2月

SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって非 … 続きを読む

カテゴリー: cs.CL, cs.LG | SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks はコメントを受け付けていません

Enhancing Textbook Question Answering Task with Large Language Models and Retrieval Augmented Generation

要約 教科書的な質問応答 (TQA) は、コンテキストとマルチモーダル データの … 続きを読む

カテゴリー: cs.AI, cs.CL | Enhancing Textbook Question Answering Task with Large Language Models and Retrieval Augmented Generation はコメントを受け付けていません

Large Language Models are Null-Shot Learners

要約 この文書では、ヌルショット プロンプトについて説明します。 ヌルショット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Models are Null-Shot Learners はコメントを受け付けていません

An Empirical Analysis of Diversity in Argument Summarization

要約 高レベルの議論を提示することは、オンラインの社会的議論への参加を促進するた … 続きを読む

カテゴリー: cs.AI, cs.CL | An Empirical Analysis of Diversity in Argument Summarization はコメントを受け付けていません

MPIrigen: MPI Code Generation through Domain-Specific Language Models

要約 多数のノードにわたって計算を拡張することが不可欠であることから、特にメッセ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.SE | MPIrigen: MPI Code Generation through Domain-Specific Language Models はコメントを受け付けていません

DolphCoder: Echo-Locating Code Large Language Models with Diverse and Multi-Objective Instruction Tuning

要約 コード大規模言語モデル (Code LLM) は、コード関連のタスクにおい … 続きを読む

カテゴリー: cs.AI, cs.CL | DolphCoder: Echo-Locating Code Large Language Models with Diverse and Multi-Objective Instruction Tuning はコメントを受け付けていません

Advancing NLP Models with Strategic Text Augmentation: A Comprehensive Study of Augmentation Methods and Curriculum Strategies

要約 この研究では、さまざまなデータセットおよび自然言語処理 (NLP) タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Advancing NLP Models with Strategic Text Augmentation: A Comprehensive Study of Augmentation Methods and Curriculum Strategies はコメントを受け付けていません

PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition

要約 この研究では、大規模言語モデル (LLM) を使用した固有表現認識 (NE … 続きを読む

カテゴリー: cs.AI, cs.CL | PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition はコメントを受け付けていません

Chinese MentalBERT: Domain-Adaptive Pre-training on Social Media for Chinese Mental Health Text Analysis

要約 現在の環境では、心理的な問題が蔓延し、広範囲にわたっており、ソーシャルメデ … 続きを読む

カテゴリー: cs.CL, cs.LG | Chinese MentalBERT: Domain-Adaptive Pre-training on Social Media for Chinese Mental Health Text Analysis はコメントを受け付けていません

OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models

要約 他者の精神状態を理解し、追跡する機械の能力である心の神経理論 (N-ToM … 続きを読む

カテゴリー: cs.AI, cs.CL | OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models はコメントを受け付けていません