cs.LG」カテゴリーアーカイブ

ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models

要約 活性化の希薄性とは、活性化出力の中に寄与度が低い要素がかなり存在することを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models はコメントを受け付けていません

Connecting the Dots: LLMs can Infer and Verbalize Latent Structure from Disparate Training Data

要約 大規模言語モデル (LLM) による安全性リスクに対処する 1 つの方法は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Connecting the Dots: LLMs can Infer and Verbalize Latent Structure from Disparate Training Data はコメントを受け付けていません

Tracking the Feature Dynamics in LLM Training: A Mechanistic Study

要約 トレーニングのダイナミクスと機能の進化を理解することは、大規模言語モデル … 続きを読む

カテゴリー: cs.CL, cs.LG | Tracking the Feature Dynamics in LLM Training: A Mechanistic Study はコメントを受け付けていません

ResearchTown: Simulator of Human Research Community

要約 大規模言語モデル (LLM) は科学分野で顕著な可能性を示していますが、根 … 続きを読む

カテゴリー: cs.CL, cs.LG | ResearchTown: Simulator of Human Research Community はコメントを受け付けていません

Evaluation of Bio-Inspired Models under Different Learning Settings For Energy Efficiency in Network Traffic Prediction

要約 携帯電話トラフィック予測は、ネットワーク オペレータが効率的にリソースを割 … 続きを読む

カテゴリー: cs.AI, cs.LG | Evaluation of Bio-Inspired Models under Different Learning Settings For Energy Efficiency in Network Traffic Prediction はコメントを受け付けていません

The Dynamic Duo of Collaborative Masking and Target for Advanced Masked Autoencoder Learning

要約 マスクされたオートエンコーダ (MAE) は最近、自己教師あり視覚表現学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, eess.SP | The Dynamic Duo of Collaborative Masking and Target for Advanced Masked Autoencoder Learning はコメントを受け付けていません

Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity

要約 最近、Linformer や Mamba などのアーキテクチャが、トランス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity はコメントを受け付けていません

PC Agent: While You Sleep, AI Works — A Cognitive Journey into Digital World

要約 研究資料の整理、レポートの下書き、明日に必要なプレゼンテーションの作成など … 続きを読む

カテゴリー: cs.AI, cs.LG | PC Agent: While You Sleep, AI Works — A Cognitive Journey into Digital World はコメントを受け付けていません

CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks

要約 最近、広範な一般知識と強力な推論能力を備えた大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks はコメントを受け付けていません

Mirage: A Multi-Level Superoptimizer for Tensor Programs

要約 テンソル プログラム用の初のマルチレベル スーパーオプティマイザーである … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PL | Mirage: A Multi-Level Superoptimizer for Tensor Programs はコメントを受け付けていません