月別アーカイブ: 2025年1月

LemmaHead: RAG Assisted Proof Generation Using Large Language Models

要約 数学的な問題を解決したり数学的証拠を書いたりするために必要なロジックを開発 … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | LemmaHead: RAG Assisted Proof Generation Using Large Language Models はコメントを受け付けていません

LMFusion: Adapting Pretrained Language Models for Multimodal Generation

要約 LMFusionを、マルチモーダル生成機能を備えた事前に守られたテキストの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | LMFusion: Adapting Pretrained Language Models for Multimodal Generation はコメントを受け付けていません

EvidenceMap: Learning Evidence Analysis to Unleash the Power of Small Language Models for Biomedical Question Answering

要約 生物医学の領域で専門的な質問に対処するとき、人間は通常、複数の情報を証拠と … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL | EvidenceMap: Learning Evidence Analysis to Unleash the Power of Small Language Models for Biomedical Question Answering はコメントを受け付けていません

Deception in LLMs: Self-Preservation and Autonomous Goals in Large Language Models

要約 大規模な言語モデル(LLMS)の最近の進歩により、計画と推論機能が組み込ま … 続きを読む

カテゴリー: cs.CL | Deception in LLMs: Self-Preservation and Autonomous Goals in Large Language Models はコメントを受け付けていません

Exploring the Role of Reasoning Structures for Constructing Proofs in Multi-Step Natural Language Reasoning with Large Language Models

要約 複雑なマルチステップの推論タスクを実行する場合、構造化された中間証明ステッ … 続きを読む

カテゴリー: cs.AI, cs.CL | Exploring the Role of Reasoning Structures for Constructing Proofs in Multi-Step Natural Language Reasoning with Large Language Models はコメントを受け付けていません

SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration

要約 偏りのない大規模な言語モデルの開発は、重要なものとして広く認識されています … 続きを読む

カテゴリー: 68T50, cs.CL, F.4.2 | SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration はコメントを受け付けていません

Contextually Structured Token Dependency Encoding for Large Language Models

要約 大規模なニューラルアーキテクチャ内のトークン表現戦略は、しばしば文脈的に洗 … 続きを読む

カテゴリー: cs.CL | Contextually Structured Token Dependency Encoding for Large Language Models はコメントを受け付けていません

Idiom Detection in Sorani Kurdish Texts

要約 自然言語処理(NLP)を使用したイディオム検出は、単語の文字通りの解釈を超 … 続きを読む

カテゴリー: cs.CL | Idiom Detection in Sorani Kurdish Texts はコメントを受け付けていません

Statistical multi-metric evaluation and visualization of LLM system predictive performance

要約 生成または識別的な大手言語モデル(LLM)ベースのシステムの評価は、多くの … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.AP | Statistical multi-metric evaluation and visualization of LLM system predictive performance はコメントを受け付けていません

How to Select Datapoints for Efficient Human Evaluation of NLG Models?

要約 人間の評価は、テキスト生成モデルを評価するための金標準です。 また、高価で … 続きを読む

カテゴリー: cs.CL | How to Select Datapoints for Efficient Human Evaluation of NLG Models? はコメントを受け付けていません