I.2.7」カテゴリーアーカイブ

$FastDoc$: Domain-Specific Fast Continual Pre-training Technique using Document-Level Metadata and Taxonomy

要約 本論文では、$FastDoc$(Fast Continual Pre-tr … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | $FastDoc$: Domain-Specific Fast Continual Pre-training Technique using Document-Level Metadata and Taxonomy はコメントを受け付けていません

CoTran: An LLM-based Code Translator using Reinforcement Learning with Feedback from Compiler and Symbolic Execution

要約 この論文では、LLM ベースのコード変換手法と、プログラム全体を 1 つの … 続きを読む

カテゴリー: cs.AI, cs.PL, cs.SE, I.2.7 | CoTran: An LLM-based Code Translator using Reinforcement Learning with Feedback from Compiler and Symbolic Execution はコメントを受け付けていません

Distinguishing Ignorance from Error in LLM Hallucinations

要約 大規模言語モデル (LLM) は、根拠のない、事実に誤りがある、または前世 … 続きを読む

カテゴリー: cs.CL, I.2.7 | Distinguishing Ignorance from Error in LLM Hallucinations はコメントを受け付けていません

LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations

要約 大規模言語モデル (LLM) は、事実の不正確さ、偏見、推論の失敗などのエ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations はコメントを受け付けていません

Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics

要約 大規模言語モデル (LLM) は、堅牢な一般化可能なアルゴリズムを学習する … 続きを読む

カテゴリー: 68T5, cs.CL, I.2.7 | Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics はコメントを受け付けていません

Large-scale cloze evaluation reveals that token prediction tasks are neither lexically nor semantically aligned

要約 この研究では、いくつかの言語モデルにおける次のトークン予測レベルでの生成動 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Large-scale cloze evaluation reveals that token prediction tasks are neither lexically nor semantically aligned はコメントを受け付けていません

Parsing Akkadian Verbs with Prolog

要約 この論文では、Prolog で実装された、接尾辞の追加が可能な、アッカド語 … 続きを読む

カテゴリー: cs.CL, I.2.7 | Parsing Akkadian Verbs with Prolog はコメントを受け付けていません

Tokenization and Morphology in Multilingual Language Models: A~Comparative Analysis of mT5 and ByT5

要約 形態論はトークン化に直接的な課題をもたらすため、多言語言語モデリングにとっ … 続きを読む

カテゴリー: cs.CL, I.2.7 | Tokenization and Morphology in Multilingual Language Models: A~Comparative Analysis of mT5 and ByT5 はコメントを受け付けていません

Everyday Speech in the Indian Subcontinent

要約 インドには 1,369 の言語があり、そのうち 22 が公用語です。 これ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS, I.2.7 | Everyday Speech in the Indian Subcontinent はコメントを受け付けていません

Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models

要約 最近の研究では、トレーニング データにおける文化と社会経済的グループの不平 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, I.2.7 | Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models はコメントを受け付けていません