「cs.AI」カテゴリーアーカイブ

SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、不正確または捏造された情報を生成すること … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

PartialFormer: Modeling Part Instead of Whole for Machine Translation

投稿日: 2024年6月6日作成者: jarxiv

要約 Transformer フィードフォワードニューラルネットワークの設計 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text Classification

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) が革命をもたらした多くのタスクの中には、テキ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

RAFT: Adapting Language Model to Domain Specific RAG

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) をテキストデータの大規模コーパスで事前トレ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

投稿日: 2024年6月6日作成者: jarxiv

要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | コメントを受け付けていません

Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository

投稿日: 2024年6月6日作成者: jarxiv

要約 LLM はコード生成タスクにおいて大きな可能性を示しており、さまざまなベン … 続きを読む →

カテゴリー: cs.AI, cs.SE | コメントを受け付けていません

Highway Value Iteration Networks

投稿日: 2024年6月6日作成者: jarxiv

要約値反復ネットワーク (VIN) は、値反復アルゴリズムを近似する微分可能な … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Analyzing LLM Behavior in Dialogue Summarization: Unveiling Circumstantial Hallucination Trends

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩により、要約システムの機能が大幅 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Future Directions in the Theory of Graph Machine Learning

投稿日: 2024年6月6日作成者: jarxiv

要約グラフに関する機械学習、特にグラフニューラルネットワーク (GNN) … 続きを読む →

カテゴリー: cs.AI, cs.DM, cs.LG, cs.NE, stat.ML | コメントを受け付けていません

Wings: Learning Multimodal LLMs without Text-only Forgetting

投稿日: 2024年6月6日作成者: jarxiv

要約トレーニングされた LLM で開始されるマルチモーダル大規模言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales

PartialFormer: Modeling Part Instead of Whole for Machine Translation

SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text Classification

RAFT: Adapting Language Model to Domain Specific RAG

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository

Highway Value Iteration Networks

Analyzing LLM Behavior in Dialogue Summarization: Unveiling Circumstantial Hallucination Trends

Future Directions in the Theory of Graph Machine Learning

Wings: Learning Multimodal LLMs without Text-only Forgetting

最近の投稿

最近のコメント

アーカイブ

カテゴリー