月別アーカイブ: 2024年9月

QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering

投稿日: 2024年9月9日作成者: jarxiv

要約行列の量子化では、行列要素をよりスペース効率の高い形式で表現してストレージ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Multi-Programming Language Ensemble for Code Generation in Large Language Model

投稿日: 2024年9月9日作成者: jarxiv

要約大規模言語モデル (LLM) により、コード生成、特にワンパスコード生成 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering

投稿日: 2024年9月9日作成者: jarxiv

要約著者プロファイリングは、個人が共有するコンテンツを分析することによって、個 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction

投稿日: 2024年9月9日作成者: jarxiv

要約中国語のスペル修正 (CSC) は、基本的な自然言語処理 (NLP) タス … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Can OpenSource beat ChatGPT? — A Comparative Study of Large Language Models for Text-to-Code Generation

投稿日: 2024年9月9日作成者: jarxiv

要約近年、大規模言語モデル (LLM) が、ソフトウェアエンジニアリングを含 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SE | コメントを受け付けていません

Towards a Unified View of Preference Learning for Large Language Models: A Survey

投稿日: 2024年9月9日作成者: jarxiv

要約大規模言語モデル (LLM) は、非常に強力な機能を発揮します。成功を達 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering

投稿日: 2024年9月9日作成者: jarxiv

要約自然言語処理の進歩により、データベースなどのデジタル情報システムと対話する … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Residual Stream Analysis with Multi-Layer SAEs

投稿日: 2024年9月9日作成者: jarxiv

要約スパースオートエンコーダー (SAE) は、トランスフォーマー言語モデル … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Fast Forwarding Low-Rank Training

投稿日: 2024年9月9日作成者: jarxiv

要約低ランク適応 (LoRA) のようなパラメーター効率の良い微調整方法は、事 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Open Language Data Initiative: Advancing Low-Resource Machine Translation for Karakalpak

投稿日: 2024年9月9日作成者: jarxiv

要約この研究では、カラカルパク言語に対するいくつかの貢献を紹介します。カラカル … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年9月

QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering

Multi-Programming Language Ensemble for Code Generation in Large Language Model

Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering

A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction

Can OpenSource beat ChatGPT? — A Comparative Study of Large Language Models for Text-to-Code Generation

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering

Residual Stream Analysis with Multi-Layer SAEs

Fast Forwarding Low-Rank Training

Open Language Data Initiative: Advancing Low-Resource Machine Translation for Karakalpak

最近の投稿

最近のコメント

アーカイブ

カテゴリー