cs.CL」カテゴリーアーカイブ

Large Language Model Confidence Estimation via Black-Box Access

要約 モデルの応答に対する不確実性または自信を推定することは、応答だけでなく、モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Model Confidence Estimation via Black-Box Access はコメントを受け付けていません

Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs

要約 大規模な言語モデルは、微調整を通じてタスク固有のアプリケーションで顕著な能 … 続きを読む

カテゴリー: cs.AI, cs.CL | Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs はコメントを受け付けていません

Towards Economical Inference: Enabling DeepSeek’s Multi-Head Latent Attention in Any Transformer-based LLMs

要約 Multi-Head Latent Atterness(MLA)は、Key … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards Economical Inference: Enabling DeepSeek’s Multi-Head Latent Attention in Any Transformer-based LLMs はコメントを受け付けていません

Revealing and Mitigating Over-Attention in Knowledge Editing

要約 大規模な言語モデルは、幅広いタスクで優れたパフォーマンスを実証していますが … 続きを読む

カテゴリー: cs.AI, cs.CL | Revealing and Mitigating Over-Attention in Knowledge Editing はコメントを受け付けていません

FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling

要約 投機的なサンプリングは、ドラフト – ヴェイロ化メカニズムを利 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling はコメントを受け付けていません

Interpretable Text Embeddings and Text Similarity Explanation: A Primer

要約 テキストの埋め込みモデルとテキスト埋め込みモデルは、多くのAIおよびNLP … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Interpretable Text Embeddings and Text Similarity Explanation: A Primer はコメントを受け付けていません

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

要約 大規模な言語モデル(LLM)は、長いシーケンスの処理において顕著な可能性を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.PF | LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention はコメントを受け付けていません

NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization

要約 画像ジオローカリゼーションは、画像の特定の位置を予測するタスクであり、視覚 … 続きを読む

カテゴリー: cs.CL, cs.CV | NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization はコメントを受け付けていません

Harnessing PDF Data for Improving Japanese Large Multimodal Models

要約 大規模なマルチモーダルモデル(LMM)は英語で強力なパフォーマンスを実証し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Harnessing PDF Data for Improving Japanese Large Multimodal Models はコメントを受け付けていません

ReVision: A Dataset and Baseline VLM for Privacy-Preserving Task-Oriented Visual Instruction Rewriting

要約 AR、VR、および強力なカメラを備えた最新のスマートフォンが人間コンピュー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ReVision: A Dataset and Baseline VLM for Privacy-Preserving Task-Oriented Visual Instruction Rewriting はコメントを受け付けていません