月別アーカイブ: 2024年9月

QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering

要約 行列の量子化では、行列要素をよりスペース効率の高い形式で表現してストレージ … 続きを読む

カテゴリー: cs.CL, cs.LG | QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering はコメントを受け付けていません

Multi-Programming Language Ensemble for Code Generation in Large Language Model

要約 大規模言語モデル (LLM) により、コード生成、特にワンパス コード生成 … 続きを読む

カテゴリー: cs.AI, cs.CL | Multi-Programming Language Ensemble for Code Generation in Large Language Model はコメントを受け付けていません

Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering

要約 著者プロファイリングは、個人が共有するコンテンツを分析することによって、個 … 続きを読む

カテゴリー: cs.CL | Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering はコメントを受け付けていません

A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction

要約 中国語のスペル修正 (CSC) は、基本的な自然言語処理 (NLP) タス … 続きを読む

カテゴリー: cs.CL | A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction はコメントを受け付けていません

Can OpenSource beat ChatGPT? — A Comparative Study of Large Language Models for Text-to-Code Generation

要約 近年、大規模言語モデル (LLM) が、ソフトウェア エンジニアリングを含 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | Can OpenSource beat ChatGPT? — A Comparative Study of Large Language Models for Text-to-Code Generation はコメントを受け付けていません

Towards a Unified View of Preference Learning for Large Language Models: A Survey

要約 大規模言語モデル (LLM) は、非常に強力な機能を発揮します。 成功を達 … 続きを読む

カテゴリー: cs.CL | Towards a Unified View of Preference Learning for Large Language Models: A Survey はコメントを受け付けていません

Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering

要約 自然言語処理の進歩により、データベースなどのデジタル情報システムと対話する … 続きを読む

カテゴリー: cs.CL | Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering はコメントを受け付けていません

Residual Stream Analysis with Multi-Layer SAEs

要約 スパース オートエンコーダー (SAE) は、トランスフォーマー言語モデル … 続きを読む

カテゴリー: cs.CL, cs.LG | Residual Stream Analysis with Multi-Layer SAEs はコメントを受け付けていません

Fast Forwarding Low-Rank Training

要約 低ランク適応 (LoRA) のようなパラメーター効率の良い微調整方法は、事 … 続きを読む

カテゴリー: cs.CL, cs.LG | Fast Forwarding Low-Rank Training はコメントを受け付けていません

Open Language Data Initiative: Advancing Low-Resource Machine Translation for Karakalpak

要約 この研究では、カラカルパク言語に対するいくつかの貢献を紹介します。カラカル … 続きを読む

カテゴリー: cs.CL | Open Language Data Initiative: Advancing Low-Resource Machine Translation for Karakalpak はコメントを受け付けていません