月別アーカイブ: 2025年3月

Model Assembly Learning with Heterogeneous Layer Weight Merging

要約 モデルのマージは、複数のモデルのパラメーターを組み合わせることにより、追加 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Model Assembly Learning with Heterogeneous Layer Weight Merging はコメントを受け付けていません

TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting

要約 時系列の予測は、経済学、エネルギー、ヘルスケア、交通管理など、多様な分野で … 続きを読む

カテゴリー: cs.AI, cs.LG | TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting はコメントを受け付けていません

COMI-LINGUA: Expert Annotated Large-Scale Dataset for Multitask NLP in Hindi-English Code-Mixing

要約 デジタル通信の急速な成長により、多言語コミュニティでは、コードミックス、特 … 続きを読む

カテゴリー: cs.AI, cs.CL | COMI-LINGUA: Expert Annotated Large-Scale Dataset for Multitask NLP in Hindi-English Code-Mixing はコメントを受け付けていません

Intelligent IoT Attack Detection Design via ODLLM with Feature Ranking-based Knowledge Base

要約 モノのインターネット(IoT)デバイスの広範な採用は、特に分散型サービス拒 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.NI | Intelligent IoT Attack Detection Design via ODLLM with Feature Ranking-based Knowledge Base はコメントを受け付けていません

LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning

要約 近年、大規模な言語モデル(LLM)は、自然言語処理(NLP)の大幅な進歩を … 続きを読む

カテゴリー: cs.AI, cs.CL | LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning はコメントを受け付けていません

Adaptive Orchestration for Large-Scale Inference on Heterogeneous Accelerator Systems Balancing Cost, Performance, and Resilience

要約 生成AIワークロードの急増により、運用コストを含めながらGPUと特殊なアク … 続きを読む

カテゴリー: 68U01, cs.AI, cs.PF | Adaptive Orchestration for Large-Scale Inference on Heterogeneous Accelerator Systems Balancing Cost, Performance, and Resilience はコメントを受け付けていません

Elementwise Layer Normalization

要約 最近の論文では、層の正規化のドロップイン置換として動的タン(DYT)を提案 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Elementwise Layer Normalization はコメントを受け付けていません

Outlier dimensions favor frequent tokens in language model

要約 最終層の外れ値の寸法、つまり、大部分の入力に対して極端なアクティベーション … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Outlier dimensions favor frequent tokens in language model はコメントを受け付けていません

Collab: Controlled Decoding using Mixture of Agents for LLM Alignment

要約 大規模な言語モデル(LLMS)のアラインメントは、アプリケーションでの安全 … 続きを読む

カテゴリー: cs.AI, cs.CL | Collab: Controlled Decoding using Mixture of Agents for LLM Alignment はコメントを受け付けていません

ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation

要約 大規模な推論モデル(LRM)は顕著な推論能力を示しますが、主にパラメトリッ … 続きを読む

カテゴリー: cs.AI, cs.CL | ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation はコメントを受け付けていません