投稿者「jarxiv」のアーカイブ

Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources

要約 高品質のデータフィルタリング、マルチモーダルデータ混合戦略、シーケンスパッ … 続きを読む

カテゴリー: cs.CL | Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources はコメントを受け付けていません

Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools

要約 はじめに:Herizon Scanning in Healthcareは、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools はコメントを受け付けていません

Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish

要約 大規模な言語モデル(LLM)は、研究と社会全体でますます重要なツールになっ … 続きを読む

カテゴリー: cs.CL | Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish はコメントを受け付けていません

Study of scaling laws in language families

要約 この記事では、言語家族内のスケーリング法則を調査し、6,000を超える言語 … 続きを読む

カテゴリー: cs.CL, physics.soc-ph | Study of scaling laws in language families はコメントを受け付けていません

ToM-RL: Reinforcement Learning Unlocks Theory of Mind in Small LLMs

要約 大規模な言語モデル(LLM)のトレーニング後の段階で適用されるルールベース … 続きを読む

カテゴリー: cs.AI, cs.CL | ToM-RL: Reinforcement Learning Unlocks Theory of Mind in Small LLMs はコメントを受け付けていません

InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation

要約 コンテキスト内学習(ICL)は、大規模な言語モデル(LLM)にとって重要で … 続きを読む

カテゴリー: cs.AI, cs.CL | InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation はコメントを受け付けていません

Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications

要約 Financial LLMSは、金融タスクとドメイン固有のアプリケーション … 続きを読む

カテゴリー: cs.CE, cs.CL, q-fin.CP | Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications はコメントを受け付けていません

OpenThaiGPT 1.6 and R1: Thai-Centric Open Source and Reasoning Large Language Models

要約 Openthaigpt 1.6およびR1(OTG-1.6およびOTG-R1 … 続きを読む

カテゴリー: cs.CL | OpenThaiGPT 1.6 and R1: Thai-Centric Open Source and Reasoning Large Language Models はコメントを受け付けていません

Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training

要約 大規模な言語モデル(LLMS)は、トレーニング前のデータに極端な言語の不均 … 続きを読む

カテゴリー: cs.CL | Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training はコメントを受け付けていません

Efficient Constant-Space Multi-Vector Retrieval

要約 コルバートアーキテクチャによって例示された多面検索方法は、検索の潜在性と有 … 続きを読む

カテゴリー: cs.CL, cs.IR | Efficient Constant-Space Multi-Vector Retrieval はコメントを受け付けていません