月別アーカイブ: 2025年2月

HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States

要約 追加のモダリティを統合すると、言語のみの対応物と比較して、脱獄攻撃などの安 … 続きを読む

カテゴリー: cs.CL | HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States はコメントを受け付けていません

Large Language Models Struggle to Describe the Haystack without Human Help: Human-in-the-loop Evaluation of LLMs

要約 NLPの一般的な使用は、従来のトピックモデルの使用から大規模な言語モデルに … 続きを読む

カテゴリー: cs.CL | Large Language Models Struggle to Describe the Haystack without Human Help: Human-in-the-loop Evaluation of LLMs はコメントを受け付けていません

TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators

要約 効率的なGPUカーネルを構築するために設計された高レベルのPythonのよ … 続きを読む

カテゴリー: cs.CL, cs.LG | TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators はコメントを受け付けていません

SurveyX: Academic Survey Automation via Large Language Models

要約 大規模な言語モデル(LLMS)は、例外的な理解能力と膨大な知識ベースを実証 … 続きを読む

カテゴリー: cs.CL | SurveyX: Academic Survey Automation via Large Language Models はコメントを受け付けていません

How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations

要約 マルチモーダルファンデーションモデルは、言語の構文やモダリティの違いなどの … 続きを読む

カテゴリー: cs.CL | How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations はコメントを受け付けていません

Measuring Faithfulness of Chains of Thought by Unlearning Reasoning Steps

要約 段階的に考えるように促されると、言語モデル(LMS)は、モデルが予測を生成 … 続きを読む

カテゴリー: cs.CL | Measuring Faithfulness of Chains of Thought by Unlearning Reasoning Steps はコメントを受け付けていません

GATE: Graph-based Adaptive Tool Evolution Across Diverse Tasks

要約 大規模な言語モデル(LLM)はツール作成に大きな期待を示していますが、既存 … 続きを読む

カテゴリー: 68T50, cs.CL, I.2.7 | GATE: Graph-based Adaptive Tool Evolution Across Diverse Tasks はコメントを受け付けていません

CLIPPER: Compression enables long-context synthetic data generation

要約 LLM開発者は合成データにますます依存していますが、複雑な長いコンテストの … 続きを読む

カテゴリー: cs.CL | CLIPPER: Compression enables long-context synthetic data generation はコメントを受け付けていません

Prompt-to-Leaderboard

要約 大規模な言語モデル(LLM)評価は、通常、精度や人間の好みなどの集計された … 続きを読む

カテゴリー: cs.CL, cs.LG | Prompt-to-Leaderboard はコメントを受け付けていません

Aligning LLMs to Ask Good Questions A Case Study in Clinical Reasoning

要約 大規模な言語モデル(LLM)は、不確実性の下で効果的な質問をすることができ … 続きを読む

カテゴリー: cs.CL | Aligning LLMs to Ask Good Questions A Case Study in Clinical Reasoning はコメントを受け付けていません