cs.LG」カテゴリーアーカイブ

Short-circuiting Shortcuts: Mechanistic Investigation of Shortcuts in Text Classification

要約 偽の相関(ショートカット)への依存は、言語モデルの多くの成功の根底にあるこ … 続きを読む

カテゴリー: cs.CL, cs.LG | Short-circuiting Shortcuts: Mechanistic Investigation of Shortcuts in Text Classification はコメントを受け付けていません

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

要約 大規模な言語モデル(LLM)が広くアクセスできるようになると、現実世界の使 … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG | Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information はコメントを受け付けていません

k-LLMmeans: Scalable, Stable, and Interpretable Text Clustering via LLM-based Centroids

要約 K-Llmmeansを紹介します。これは、LLMで生成された要約をクラスタ … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | k-LLMmeans: Scalable, Stable, and Interpretable Text Clustering via LLM-based Centroids はコメントを受け付けていません

Towards Robust Few-Shot Text Classification Using Transformer Architectures and Dual Loss Strategies

要約 少ないショットテキスト分類には、低リソース環境で重要なアプリケーション値が … 続きを読む

カテゴリー: cs.CL, cs.LG | Towards Robust Few-Shot Text Classification Using Transformer Architectures and Dual Loss Strategies はコメントを受け付けていません

From Models to Network Topologies: A Topology Inference Attack in Decentralized Federated Learning

要約 Federated Learning(FL)は、直接データ交換を回避するモ … 続きを読む

カテゴリー: cs.AI, cs.LG | From Models to Network Topologies: A Topology Inference Attack in Decentralized Federated Learning はコメントを受け付けていません

LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization

要約 Alphafold2やESMFoldなどのタンパク質構造予測モデル(PPM … 続きを読む

カテゴリー: B.7, cs.AI, cs.AR, cs.ET, cs.LG | LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization はコメントを受け付けていません

IRNN: Innovation-driven Recurrent Neural Network for Time-Series Data Modeling and Prediction

要約 多くの現実世界のデータセットは、連続的に収集され、豊富な時間情報を含む時系 … 続きを読む

カテゴリー: cs.AI, cs.LG | IRNN: Innovation-driven Recurrent Neural Network for Time-Series Data Modeling and Prediction はコメントを受け付けていません

Elastic Weight Consolidation for Full-Parameter Continual Pre-Training of Gemma2

要約 このテクニカルレポートでは、継続的な学習の観点からCulturaxのリトア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Elastic Weight Consolidation for Full-Parameter Continual Pre-Training of Gemma2 はコメントを受け付けていません

Universal Approximation Theorem for Deep Q-Learning via FBSDE System

要約 ディープQネットワーク(DQNS)の近似能力は、一般的に、ベルマン方程式の … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Universal Approximation Theorem for Deep Q-Learning via FBSDE System はコメントを受け付けていません

PYRREGULAR: A Unified Framework for Irregular Time Series, with Classification Benchmarks

要約 さまざまな記録頻度、異なる観測期間、および欠損値を特徴とする不規則な時間デ … 続きを読む

カテゴリー: cs.AI, cs.LG | PYRREGULAR: A Unified Framework for Irregular Time Series, with Classification Benchmarks はコメントを受け付けていません