月別アーカイブ: 2024年3月

HealMe: Harnessing Cognitive Reframing in Large Language Models for Psychotherapy

要約 大規模言語モデル (LLM) は、認知的リフレーミングという重要なタスクを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, J.4 | HealMe: Harnessing Cognitive Reframing in Large Language Models for Psychotherapy はコメントを受け付けていません

Zero-Shot Cross-Lingual Document-Level Event Causality Identification with Heterogeneous Graph Contrastive Transfer Learning

要約 イベント因果関係特定 (ECI) は、テキスト内のイベント間の因果関係の検 … 続きを読む

カテゴリー: cs.AI, cs.CL | Zero-Shot Cross-Lingual Document-Level Event Causality Identification with Heterogeneous Graph Contrastive Transfer Learning はコメントを受け付けていません

ESG Classification by Implicit Rule Learning via GPT-4

要約 環境、社会、ガバナンス (ESG) 要因は、より高い投資収益率の指標として … 続きを読む

カテゴリー: cs.CL | ESG Classification by Implicit Rule Learning via GPT-4 はコメントを受け付けていません

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

要約 事前トレーニングされた大規模言語モデル (LLM) は、現在、自然言語処理 … 続きを読む

カテゴリー: cs.CL | LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement はコメントを受け付けていません

ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition

要約 自己注意は大規模言語モデル (LLM) の重要なコンポーネントですが、長い … 続きを読む

カテゴリー: cs.CL, cs.LG | ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition はコメントを受け付けていません

Align-to-Distill: Trainable Attention Alignment for Knowledge Distillation in Neural Machine Translation

要約 スケーラブルなディープ モデルと大規模なデータセットの出現により、ニューラ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | Align-to-Distill: Trainable Attention Alignment for Knowledge Distillation in Neural Machine Translation はコメントを受け付けていません

E-Sparse: Boosting the Large Language Model Inference through Entropy-based N:M Sparsity

要約 従来の枝刈り手法は、費用がかからないトレーニング プロセスと大量の計算要求 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | E-Sparse: Boosting the Large Language Model Inference through Entropy-based N:M Sparsity はコメントを受け付けていません

Construction of a Japanese Financial Benchmark for Large Language Models

要約 最近の大規模言語モデル (LLM) の開発に伴い、特定のドメインと言語に焦 … 続きを読む

カテゴリー: cs.CL, q-fin.CP | Construction of a Japanese Financial Benchmark for Large Language Models はコメントを受け付けていません

Self-Guard: Empower the LLM to Safeguard Itself

要約 ジェイルブレイク攻撃は、Large Language Model (LLM … 続きを読む

カテゴリー: cs.CL | Self-Guard: Empower the LLM to Safeguard Itself はコメントを受け付けていません

CHisIEC: An Information Extraction Corpus for Ancient Chinese History

要約 自然言語処理 (NLP) は、デジタル ヒューマニティー (DH) の分野 … 続きを読む

カテゴリー: cs.CL | CHisIEC: An Information Extraction Corpus for Ancient Chinese History はコメントを受け付けていません