投稿者「jarxiv」のアーカイブ

AlpaCare:Instruction-tuned Large Language Models for Medical Application

要約 指導対象(IFT)は、大規模な言語モデル(LLM)を多様な人間のニーズに合 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Don’t lie to your friends: Learning what you know from collaborative self-play

要約 役立つアシスタントになるには、AIエージェントは自分の能力と制限に注意する … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder

要約 命令チューニングデータは、データ収集と高速モデルの反復により、多くの場合数 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

How Well do LLMs Compress Their Own Chain-of-Thought? A Token Complexity Approach

要約 チェーンオブテルのプロンプトは、大規模な言語モデル(LLM)が複雑な推論タ … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems

要約 この論文は、詳細な人類学的枠組みと併せてハイブリッドCNNトランスフォーカ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

Non-Determinism of ‘Deterministic’ LLM Settings

要約 LLM(大規模な言語モデル)開業医は、一般に、出力が決定論的と予想される設 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントする

CancerLLM: A Large Language Model in Cancer Domain

要約 医療大規模な言語モデル(LLMS)は、さまざまな医療NLPタスクで印象的な … 続きを読む

カテゴリー: cs.CL | コメントする

CoRanking: Collaborative Ranking with Small and Large Ranking Agents

要約 大規模な言語モデル(LLMS)は、リストワイズランキングのパフォーマンスを … 続きを読む

カテゴリー: cs.CL, cs.IR | コメントする

Lean Formalization of Generalization Error Bound by Rademacher Complexity

要約 Lean 4定理を使用して、Rademacherの複雑さを使用して、一般化 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.ST, stat.TH | コメントする

Self-Vocabularizing Training for Neural Machine Translation

要約 過去の語彙学習手法は、トレーニング前に関連する語彙を特定し、モデルトレーニ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする