「cs.AI」カテゴリーアーカイブ

Active Preference Optimization for Sample Efficient RLHF

投稿日: 2024年6月6日作成者: jarxiv

要約人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Grokfast: Accelerated Grokking by Amplifying Slow Gradients

投稿日: 2024年6月6日作成者: jarxiv

要約機械学習におけるグロッキングと呼ばれる不可解なアーティファクトの 1 つは … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad

投稿日: 2024年6月6日作成者: jarxiv

要約適応手法は、学習率の調整を低コストで行えるため、機械学習において非常に人気 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、広範な基礎知識と適度な推論能力を備えてい … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) が広く採用されているにもかかわらず、その優れ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Large Language Models Can Infer Psychological Dispositions of Social Media Users

投稿日: 2024年6月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなタスクにわたってますます人間に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG, cs.SI | コメントを受け付けていません

I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models

投稿日: 2024年6月6日作成者: jarxiv

要約ポストトレーニング量子化 (PTQ) は、大規模言語モデル (LLM) の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub

投稿日: 2024年6月6日作成者: jarxiv

要約オープンモデルの開発者は、人工知能 (AI) の政治経済における主要な主 … 続きを読む →

カテゴリー: cs.AI, cs.CY, cs.LG, cs.SE, K.4.1 | コメントを受け付けていません

Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost

投稿日: 2024年6月6日作成者: jarxiv

要約 Retriever Augmented Generation (RAG) … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them)

投稿日: 2024年6月6日作成者: jarxiv

要約人工知能 (AI) / 機械学習 (ML) が広く採用されるにつれ、実務者 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Active Preference Optimization for Sample Efficient RLHF

Grokfast: Accelerated Grokking by Amplifying Slow Gradients

Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad

CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning

IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

Large Language Models Can Infer Psychological Dispositions of Social Media Users

I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models

The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub

Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost

Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them)

最近の投稿

最近のコメント

アーカイブ

カテゴリー