投稿者「jarxiv」のアーカイブ

Towards a Unified Representation Evaluation Framework Beyond Downstream Tasks

要約 ダウンストリームプローブは、モデル表現を評価するための支配的な方法であり、 … 続きを読む

カテゴリー: cs.LG | Towards a Unified Representation Evaluation Framework Beyond Downstream Tasks はコメントを受け付けていません

A Machine-Learning Compositional Study of Exoplanetary Material Accreted Onto Five Helium-Atmosphere White Dwarfs with $\texttt{cecilia}$

要約 機械学習(ML)パイプライン$ \ texttt {cecilia} $の … 続きを読む

カテゴリー: astro-ph.EP, astro-ph.IM, astro-ph.SR, cs.LG | A Machine-Learning Compositional Study of Exoplanetary Material Accreted Onto Five Helium-Atmosphere White Dwarfs with $\texttt{cecilia}$ はコメントを受け付けていません

Insertion Language Models: Sequence Generation with Arbitrary-Position Insertions

要約 それに続くトークンを1つずつ「左から右に」予測するオートレーリングモデル( … 続きを読む

カテゴリー: cs.CL, cs.LG | Insertion Language Models: Sequence Generation with Arbitrary-Position Insertions はコメントを受け付けていません

BMMDetect: A Multimodal Deep Learning Framework for Comprehensive Biomedical Misconduct Detection

要約 生物医学研究における学術的不正行為の検出既存の方法と断片化された分析パイプ … 続きを読む

カテゴリー: cs.CL, cs.LG | BMMDetect: A Multimodal Deep Learning Framework for Comprehensive Biomedical Misconduct Detection はコメントを受け付けていません

RWKV-X: A Linear Complexity Hybrid Language Model

要約 このペーパーでは、RWKV-Xを紹介します。RWKV-Xは、短距離モデリン … 続きを読む

カテゴリー: cs.CL | RWKV-X: A Linear Complexity Hybrid Language Model はコメントを受け付けていません

Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM

要約 変圧器ベースのモデルは、最新の機械学習の基礎ですが、特に大規模な言語モデル … 続きを読む

カテゴリー: cs.CL, cs.LG | Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM はコメントを受け付けていません

JustLogic: A Comprehensive Benchmark for Evaluating Deductive Reasoning in Large Language Models

要約 論理的推論は、大規模な言語モデル(LLM)の重要な要素であり、近年の実質的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | JustLogic: A Comprehensive Benchmark for Evaluating Deductive Reasoning in Large Language Models はコメントを受け付けていません

Estimating LLM Uncertainty with Evidence

要約 過去数年にわたって、大規模な言語モデル(LLM)は急速に開発されており、さ … 続きを読む

カテゴリー: cs.AI, cs.CL | Estimating LLM Uncertainty with Evidence はコメントを受け付けていません

AdaCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Chain-of-Thought

要約 大規模な言語モデルは、多様なコーパスを事前に削除することにより、印象的な多 … 続きを読む

カテゴリー: cs.AI, cs.CL | AdaCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Chain-of-Thought はコメントを受け付けていません

Tell Me Who Your Students Are: GPT Can Generate Valid Multiple-Choice Questions When Students’ (Mis)Understanding Is Hinted

要約 この研究の主な目標は、事前に訓練された大規模な言語モデルを使用して複数選択 … 続きを読む

カテゴリー: cs.CL | Tell Me Who Your Students Are: GPT Can Generate Valid Multiple-Choice Questions When Students’ (Mis)Understanding Is Hinted はコメントを受け付けていません