月別アーカイブ: 2024年8月

Preference-Guided Reflective Sampling for Aligning Language Models

要約 大規模言語モデル (LLM) は、人間のフィードバックからの強化学習 (R … 続きを読む

カテゴリー: cs.CL | Preference-Guided Reflective Sampling for Aligning Language Models はコメントを受け付けていません

KLoB: a Benchmark for Assessing Knowledge Locating Methods in Language Models

要約 最近、言語モデルに保存されている事実の知識を変更するための主要なアプローチ … 続きを読む

カテゴリー: cs.AI, cs.CL | KLoB: a Benchmark for Assessing Knowledge Locating Methods in Language Models はコメントを受け付けていません

FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation

要約 大規模言語モデル (LLM) は私たちの日常生活でますます普及しており、L … 続きを読む

カテゴリー: cs.CL | FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation はコメントを受け付けていません

Revisiting the Phenomenon of Syntactic Complexity Convergence on German Dialogue Data

要約 我々は、もともと英語の対話で見出された、相互理解などの対話概念に理論的な意 … 続きを読む

カテゴリー: cs.CL | Revisiting the Phenomenon of Syntactic Complexity Convergence on German Dialogue Data はコメントを受け付けていません

Reasoning Factual Knowledge in Structured Data with Large Language Models

要約 大規模言語モデル (LLM) は、事実の知識を理解して推論する能力の利点と … 続きを読む

カテゴリー: cs.AI, cs.CL | Reasoning Factual Knowledge in Structured Data with Large Language Models はコメントを受け付けていません

Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment

要約 BERT や T5 などの事前トレーニング済み言語モデルは、高密度検索のた … 続きを読む

カテゴリー: cs.CL | Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment はコメントを受け付けていません

SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM

要約 大規模言語モデル (LLM) はさまざまな分野で目覚ましい成功を収めていま … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM はコメントを受け付けていません

EvalYaks: Instruction Tuning Datasets and LoRA Fine-tuned Models for Automated Scoring of CEFR B2 Speaking Assessment Transcripts

要約 e ラーニング環境での CEFR スピーキング評価の評価を人間の専門家に依 … 続きを読む

カテゴリー: cs.AI, cs.CL | EvalYaks: Instruction Tuning Datasets and LoRA Fine-tuned Models for Automated Scoring of CEFR B2 Speaking Assessment Transcripts はコメントを受け付けていません

LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction

要約 大規模言語モデル (LLM) は医療分野のアプリケーションに採用されること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction はコメントを受け付けていません

A Language-agnostic Model of Child Language Acquisition

要約 この研究では、もともと英語用に設計された最近のセマンティック ブートストラ … 続きを読む

カテゴリー: cs.AI, cs.CL | A Language-agnostic Model of Child Language Acquisition はコメントを受け付けていません