投稿者「jarxiv」のアーカイブ

Efficient $1$-bit tensor approximations

要約 $\{-1, 1\}$ 値のベクトルのテンソル積の線形結合として、行列と任 … 続きを読む

カテゴリー: cs.LG, cs.MS, cs.NA, math.CO, math.NA | コメントする

On the expressiveness and spectral bias of KANs

要約 コルモゴロフ-アーノルド ネットワーク (KAN) \cite{liu20 … 続きを読む

カテゴリー: cs.LG | コメントする

PROXI: Challenging the GNNs for Link Prediction

要約 過去 10 年にわたり、グラフ ニューラル ネットワーク (GNN) はグ … 続きを読む

カテゴリー: cs.CG, cs.LG | コメントする

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

要約 多くのユースケースでは、テキストのより小さい部分を取得する必要があり、埋め … 続きを読む

カテゴリー: 68T50, cs.CL, cs.IR, I.2.7 | コメントする

On The Adaptation of Unlimiformer for Decoder-Only Transformers

要約 現世代の大規模言語モデルを妨げる顕著な問題の 1 つは、コンテキストの長さ … 続きを読む

カテゴリー: cs.CL | コメントする

DeIDClinic: A Multi-Layered Framework for De-identification of Clinical Free-text Data

要約 匿名化は、医療テキスト分析において患者のプライバシーを保護する上で重要です … 続きを読む

カテゴリー: cs.CL | コメントする

What is ‘Typological Diversity’ in NLP?

要約 NLP 研究コミュニティは、英語以外の言語にもますます注目を集めており、そ … 続きを読む

カテゴリー: cs.CL | コメントする

Addition is All You Need for Energy-efficient Language Models

要約 大規模なニューラル ネットワークは、ほとんどの計算を浮動小数点テンソル乗算 … 続きを読む

カテゴリー: cs.CL | コメントする

TuBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning

要約 英語中心の大規模言語モデル (LLM) に対するバックドア攻撃の影響は広く … 続きを読む

カテゴリー: cs.CL, cs.CR | コメントする

VinePPO: Unlocking RL Potential For LLM Reasoning Through Refined Credit Assignment

要約 大規模言語モデル (LLM) は、報酬を受け取る前にいくつかの複雑なステッ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする