cs.CL」カテゴリーアーカイブ

DualKanbaFormer: Kolmogorov-Arnold Networks and State Space Model Transformer for Multimodal Aspect-based Sentiment Analysis

要約 マルチモーダル アスペクトベースセンチメント分析 (MABSA) は、テキ … 続きを読む

カテゴリー: cs.CL | DualKanbaFormer: Kolmogorov-Arnold Networks and State Space Model Transformer for Multimodal Aspect-based Sentiment Analysis はコメントを受け付けていません

Exploring Group and Symmetry Principles in Large Language Models

要約 大規模言語モデル (LLM) は、幅広いアプリケーションにわたって優れたパ … 続きを読む

カテゴリー: cs.CL | Exploring Group and Symmetry Principles in Large Language Models はコメントを受け付けていません

CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models

要約 歴史的な印刷メディアアーカイブのデジタル化は、現代の記録へのアクセスを増や … 続きを読む

カテゴリー: cs.CL, cs.DL | CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models はコメントを受け付けていません

SYNTHEVAL: Hybrid Behavioral Testing of NLP Models with Synthetic CheckLists

要約 NLP における従来のベンチマークでは、通常、静的に保持されたテスト セッ … 続きを読む

カテゴリー: cs.CL | SYNTHEVAL: Hybrid Behavioral Testing of NLP Models with Synthetic CheckLists はコメントを受け付けていません

TaSL: Task Skill Localization and Consolidation for Language Model Continual Learning

要約 言語モデルの継続学習 (CL) は、再トレーニングせずに大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL | TaSL: Task Skill Localization and Consolidation for Language Model Continual Learning はコメントを受け付けていません

Jailbreak Attacks and Defenses Against Large Language Models: A Survey

要約 大規模言語モデル (LLM) は、質問応答、翻訳、コード補完などを含むさま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Jailbreak Attacks and Defenses Against Large Language Models: A Survey はコメントを受け付けていません

Flexible and Effective Mixing of Large Language Models into a Mixture of Domain Experts

要約 トレーニング済みモデルから低コストの混合ドメイン専門家 (MOE) を作成 … 続きを読む

カテゴリー: cs.AI, cs.CL | Flexible and Effective Mixing of Large Language Models into a Mixture of Domain Experts はコメントを受け付けていません

Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer

要約 Mixture of Experts (MoE) は、大幅な追加の計算コス … 続きを読む

カテゴリー: cs.AI, cs.CL | Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer はコメントを受け付けていません

Bridging Domain Knowledge and Process Discovery Using Large Language Models

要約 適切なプロセス モデルを発見することは、適合性チェックやプロセス改善などの … 続きを読む

カテゴリー: cs.AI, cs.CL | Bridging Domain Knowledge and Process Discovery Using Large Language Models はコメントを受け付けていません

Modularity in Transformers: Investigating Neuron Separability & Specialization

要約 変圧器モデルはさまざまなアプリケーションでますます普及していますが、その内 … 続きを読む

カテゴリー: (Primary), 68T05, cs.AI, cs.CL, cs.LG, I.2.4 | Modularity in Transformers: Investigating Neuron Separability & Specialization はコメントを受け付けていません