cs.AI」カテゴリーアーカイブ

Active Preference Optimization for Sample Efficient RLHF

要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Active Preference Optimization for Sample Efficient RLHF はコメントを受け付けていません

Grokfast: Accelerated Grokking by Amplifying Slow Gradients

要約 機械学習におけるグロッキングと呼ばれる不可解なアーティファクトの 1 つは … 続きを読む

カテゴリー: cs.AI, cs.LG | Grokfast: Accelerated Grokking by Amplifying Slow Gradients はコメントを受け付けていません

Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad

要約 適応手法は、学習率の調整を低コストで行えるため、機械学習において非常に人気 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad はコメントを受け付けていません

CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning

要約 大規模言語モデル (LLM) は、広範な基礎知識と適度な推論能力を備えてい … 続きを読む

カテゴリー: cs.AI | CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning はコメントを受け付けていません

IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

要約 大規模言語モデル (LLM) が広く採用されているにもかかわらず、その優れ … 続きを読む

カテゴリー: cs.AI, cs.CL | IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models はコメントを受け付けていません

Large Language Models Can Infer Psychological Dispositions of Social Media Users

要約 大規模言語モデル (LLM) は、さまざまなタスクにわたってますます人間に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG, cs.SI | Large Language Models Can Infer Psychological Dispositions of Social Media Users はコメントを受け付けていません

I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models

要約 ポストトレーニング量子化 (PTQ) は、大規模言語モデル (LLM) の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models はコメントを受け付けていません

The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub

要約 オープン モデルの開発者は、人工知能 (AI) の政治経済における主要な主 … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG, cs.SE, K.4.1 | The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub はコメントを受け付けていません

Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost

要約 Retriever Augmented Generation (RAG) … 続きを読む

カテゴリー: cs.AI, cs.CL | Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost はコメントを受け付けていません

Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them)

要約 人工知能 (AI) / 機械学習 (ML) が広く採用されるにつれ、実務者 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them) はコメントを受け付けていません