月別アーカイブ: 2024年6月

Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping

要約 自己調整は、確実なモデル機能を確保しながら、人間によるアノテーションのコス … 続きを読む

カテゴリー: cs.AI, cs.CL | Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping はコメントを受け付けていません

LiveBench: A Challenging, Contamination-Free LLM Benchmark

要約 ベンチマークからのテスト データが新しいモデルのトレーニング セットに入る … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LiveBench: A Challenging, Contamination-Free LLM Benchmark はコメントを受け付けていません

Jump Starting Bandits with LLM-Generated Prior Knowledge

要約 私たちは、大規模言語モデル (LLM) をコンテキスト マルチアーム バン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Jump Starting Bandits with LLM-Generated Prior Knowledge はコメントを受け付けていません

WebCanvas: Benchmarking Web Agents in Online Environments

要約 Web エージェントが実際に役立つためには、ユーザー インターフェイスとコ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2.7 | WebCanvas: Benchmarking Web Agents in Online Environments はコメントを受け付けていません

CHESS: Contextual Harnessing for Efficient SQL Synthesis

要約 自然言語の質問を SQL クエリ (テキストから SQL) に変換するため … 続きを読む

カテゴリー: cs.AI, cs.DB, cs.LG | CHESS: Contextual Harnessing for Efficient SQL Synthesis はコメントを受け付けていません

Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications

要約 大規模言語モデル (LLM) は、ジェイルブレイクや、さらには悪意のない微 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications はコメントを受け付けていません

IndoToxic2024: A Demographically-Enriched Dataset of Hate Speech and Toxicity Types for Indonesian Language

要約 ヘイトスピーチは社会の調和に重大な脅威をもたらします。 過去 2 年間で、 … 続きを読む

カテゴリー: cs.AI, cs.CL | IndoToxic2024: A Demographically-Enriched Dataset of Hate Speech and Toxicity Types for Indonesian Language はコメントを受け付けていません

Fundamental Problems With Model Editing: How Should Rational Belief Revision Work in LLMs?

要約 モデル編集の問題は、言語モデルが時間の経過とともに世界に関する新しい事実を … 続きを読む

カテゴリー: cs.AI, cs.CL | Fundamental Problems With Model Editing: How Should Rational Belief Revision Work in LLMs? はコメントを受け付けていません

Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space

要約 最新の生成モデルは、トレーニング データの基礎となる抽象概念を識別して操作 … 続きを読む

カテゴリー: cs.AI, cs.LG | Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space はコメントを受け付けていません

The Remarkable Robustness of LLMs: Stages of Inference?

要約 隣接するレイヤーを削除および交換することにより、大規模言語モデルの顕著な堅 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Remarkable Robustness of LLMs: Stages of Inference? はコメントを受け付けていません