「cs.CL」カテゴリーアーカイブ

MSTS: A Multimodal Safety Test Suite for Vision-Language Models

投稿日: 2025年1月20日作成者: jarxiv

要約画像およびテキスト入力を処理するビジョン言語モデル (VLM) は、チャッ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

OMoE: Diversifying Mixture of Low-Rank Adaptation by Orthogonal Finetuning

投稿日: 2025年1月20日作成者: jarxiv

要約低ランク適応 (LoRA) のための専門家混合 (MoE) アーキテクチャ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Structured Packing in LLM Training Improves Long Context Utilization

投稿日: 2025年1月20日作成者: jarxiv

要約ロングコンテキストの大規模言語モデルの最近の進歩は大きな注目を集めています … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models

投稿日: 2025年1月20日作成者: jarxiv

要約大規模言語モデル (LLM) に関する研究では、最近、長いドキュメント内の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching

投稿日: 2025年1月20日作成者: jarxiv

要約大規模言語モデル (LLM) は、幅広い情報処理および管理タスクにおいてま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | コメントを受け付けていません

Author-Specific Linguistic Patterns Unveiled: A Deep Learning Study on Word Class Distributions

投稿日: 2025年1月20日作成者: jarxiv

要約深層学習手法は、テキストデータのパターンを明らかにするために、計算言語学 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ComplexFuncBench: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario

投稿日: 2025年1月20日作成者: jarxiv

要約リアルタイム API を使用して大規模言語モデル (LLM) を強化すると … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

How Redundant Is the Transformer Stack in Speech Representation Models?

投稿日: 2025年1月20日作成者: jarxiv

要約自己教師あり音声表現モデル、特にトランスアーキテクチャを活用したモデルは … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Multi-stage Training of Bilingual Islamic LLM for Neural Passage Retrieval

投稿日: 2025年1月20日作成者: jarxiv

要約この研究は、イスラムの神経検索モデルの開発に焦点を当て、イスラム領域内での … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Bandit on the Hunt: Dynamic Crawling for Cyber Threat Intelligence

投稿日: 2025年1月20日作成者: jarxiv

要約公開情報には、将来の攻撃を防ぐために使用される貴重なサイバー脅威インテリジ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

MSTS: A Multimodal Safety Test Suite for Vision-Language Models

OMoE: Diversifying Mixture of Low-Rank Adaptation by Orthogonal Finetuning

Structured Packing in LLM Training Improves Long Context Utilization

ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models

BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching

Author-Specific Linguistic Patterns Unveiled: A Deep Learning Study on Word Class Distributions

ComplexFuncBench: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario

How Redundant Is the Transformer Stack in Speech Representation Models?

Multi-stage Training of Bilingual Islamic LLM for Neural Passage Retrieval

Bandit on the Hunt: Dynamic Crawling for Cyber Threat Intelligence

最近の投稿

最近のコメント

アーカイブ

カテゴリー