月別アーカイブ: 2025年4月

On true empty category

要約 Chomsky(1981、1986)によると、空のカテゴリはPro、Pro … 続きを読む

カテゴリー: cs.CL | On true empty category はコメントを受け付けていません

HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States

要約 追加のモダリティを統合すると、言語のみの対応物と比較して、脱獄攻撃などの安 … 続きを読む

カテゴリー: cs.CL | HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States はコメントを受け付けていません

EvalAgent: Discovering Implicit Evaluation Criteria from the Web

要約 構造化されたライティングタスクでの言語モデル出力の評価は、通常、人間の評価 … 続きを読む

カテゴリー: cs.CL | EvalAgent: Discovering Implicit Evaluation Criteria from the Web はコメントを受け付けていません

Fully Bayesian Approaches to Topics over Time

要約 時間の経過とともにトピック(TOT)モデルは、Word共起パターンと共同で … 続きを読む

カテゴリー: cs.CL, cs.LG | Fully Bayesian Approaches to Topics over Time はコメントを受け付けていません

MR. Guard: Multilingual Reasoning Guardrail using Curriculum Learning

要約 大規模な言語モデル(LLM)は、侵入などの敵対的な攻撃の影響を受けやすく、 … 続きを読む

カテゴリー: cs.CL | MR. Guard: Multilingual Reasoning Guardrail using Curriculum Learning はコメントを受け付けていません

Can LLMs Rank the Harmfulness of Smaller LLMs? We are Not There Yet

要約 大規模な言語モデル(LLM)は遍在するため、リスクと制限を理解することが重 … 続きを読む

カテゴリー: cs.CL | Can LLMs Rank the Harmfulness of Smaller LLMs? We are Not There Yet はコメントを受け付けていません

Evaluating Judges as Evaluators: The JETTS Benchmark of LLM-as-Judges as Test-Time Scaling Evaluators

要約 テスト時間計算のスケーリング、または推論中に発電機の大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.LG | Evaluating Judges as Evaluators: The JETTS Benchmark of LLM-as-Judges as Test-Time Scaling Evaluators はコメントを受け付けていません

CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation

要約 Cからust骨の輸送は、現代の錆生態系との安全性と相互運用性を高めながら、 … 続きを読む

カテゴリー: cs.CL, cs.SE | CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation はコメントを受け付けていません

DataComp-LM: In search of the next generation of training sets for language models

要約 言語モデルを改善することを目的とした、制御されたデータセット実験のテストベ … 続きを読む

カテゴリー: cs.CL, cs.LG | DataComp-LM: In search of the next generation of training sets for language models はコメントを受け付けていません

Federated Latent Factor Model for Bias-Aware Recommendation with Privacy-Preserving

要約 推奨システム(RS)は、ユーザーにパーソナライズされたアイテムの推奨事項を … 続きを読む

カテゴリー: cs.AI, cs.LG | Federated Latent Factor Model for Bias-Aware Recommendation with Privacy-Preserving はコメントを受け付けていません