cs.AI」カテゴリーアーカイブ

SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales

要約 大規模言語モデル (LLM) は、不正確または捏造された情報を生成すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales はコメントを受け付けていません

PartialFormer: Modeling Part Instead of Whole for Machine Translation

要約 Transformer フィードフォワード ニューラル ネットワークの設計 … 続きを読む

カテゴリー: cs.AI, cs.CL | PartialFormer: Modeling Part Instead of Whole for Machine Translation はコメントを受け付けていません

SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text Classification

要約 大規模言語モデル (LLM) が革命をもたらした多くのタスクの中には、テキ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text Classification はコメントを受け付けていません

RAFT: Adapting Language Model to Domain Specific RAG

要約 大規模言語モデル (LLM) をテキスト データの大規模コーパスで事前トレ … 続きを読む

カテゴリー: cs.AI, cs.CL | RAFT: Adapting Language Model to Domain Specific RAG はコメントを受け付けていません

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead はコメントを受け付けていません

Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository

要約 LLM はコード生成タスクにおいて大きな可能性を示しており、さまざまなベン … 続きを読む

カテゴリー: cs.AI, cs.SE | Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository はコメントを受け付けていません

Highway Value Iteration Networks

要約 値反復ネットワーク (VIN) は、値反復アルゴリズムを近似する微分可能な … 続きを読む

カテゴリー: cs.AI, cs.LG | Highway Value Iteration Networks はコメントを受け付けていません

Analyzing LLM Behavior in Dialogue Summarization: Unveiling Circumstantial Hallucination Trends

要約 大規模言語モデル (LLM) の最近の進歩により、要約システムの機能が大幅 … 続きを読む

カテゴリー: cs.AI, cs.CL | Analyzing LLM Behavior in Dialogue Summarization: Unveiling Circumstantial Hallucination Trends はコメントを受け付けていません

Future Directions in the Theory of Graph Machine Learning

要約 グラフに関する機械学習、特にグラフ ニューラル ネットワーク (GNN) … 続きを読む

カテゴリー: cs.AI, cs.DM, cs.LG, cs.NE, stat.ML | Future Directions in the Theory of Graph Machine Learning はコメントを受け付けていません

Wings: Learning Multimodal LLMs without Text-only Forgetting

要約 トレーニングされた LLM で開始されるマルチモーダル大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Wings: Learning Multimodal LLMs without Text-only Forgetting はコメントを受け付けていません