月別アーカイブ: 2024年6月

SetBERT: Enhancing Retrieval Performance for Boolean Logic and Set Operation Queries

要約 SetBERT は、集合演算やブール論理クエリ (積集合 (AND)、差分 … 続きを読む

カテゴリー: cs.CL | SetBERT: Enhancing Retrieval Performance for Boolean Logic and Set Operation Queries はコメントを受け付けていません

DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution

要約 大規模な事前トレーニング済みモデルの微調整は、本質的にリソースを大量に消費 … 続きを読む

カテゴリー: cs.CL | DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution はコメントを受け付けていません

Do LLMs dream of elephants (when told not to)? Latent concept association and associative memory in transformers

要約 大規模言語モデル (LLM) には、事実を保存および呼び出す機能があります … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | Do LLMs dream of elephants (when told not to)? Latent concept association and associative memory in transformers はコメントを受け付けていません

MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification

要約 大規模マルチモーダル モデル (LMM) におけるマルチモーダル数学推論の … 続きを読む

カテゴリー: cs.CL | MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification はコメントを受け付けていません

LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks

要約 人間の判断ではなく、LLM が生成した判断を使用して NLP モデルを評価 … 続きを読む

カテゴリー: cs.CL | LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks はコメントを受け付けていません

Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models

要約 大規模言語モデル (LLM) は、特にテキストの数学的問題解決において、優 … 続きを読む

カテゴリー: cs.CL | Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models はコメントを受け付けていません

WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

要約 WildGuard を紹介します。これは、(1) ユーザー プロンプト内の … 続きを読む

カテゴリー: cs.CL | WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs はコメントを受け付けていません

Is In-Context Learning a Type of Gradient-Based Learning? Evidence from the Inverse Frequency Effect in Structural Priming

要約 大規模言語モデル (LLM) は、コンテキスト内学習 (ICL) の新たな … 続きを読む

カテゴリー: cs.CL | Is In-Context Learning a Type of Gradient-Based Learning? Evidence from the Inverse Frequency Effect in Structural Priming はコメントを受け付けていません

BASS: Batched Attention-optimized Speculative Sampling

要約 投機的デコードは、大規模な言語モデルをホストする際の待ち時間とスループット … 続きを読む

カテゴリー: cs.CL, cs.LG | BASS: Batched Attention-optimized Speculative Sampling はコメントを受け付けていません

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

要約 WildTeaming は、自動 LLM 安全レッドチーム フレームワーク … 続きを読む

カテゴリー: cs.CL | WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models はコメントを受け付けていません