cs.AI」カテゴリーアーカイブ

Subtle Errors Matter: Preference Learning via Error-injected Self-editing

要約 ラージ・ランゲージ・モデル(LLM)は、基本的な算数から高度な競技レベルの … 続きを読む

カテゴリー: cs.AI, cs.CL | Subtle Errors Matter: Preference Learning via Error-injected Self-editing はコメントを受け付けていません

Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework

要約 大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、ます … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework はコメントを受け付けていません

Test-Time Compute: from System-1 Thinking to System-2 Thinking

要約 複雑な推論におけるo1モデルの顕著な性能は、テスト時間の計算スケーリングが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Test-Time Compute: from System-1 Thinking to System-2 Thinking はコメントを受け付けていません

DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life

要約 日常生活における意思決定において、ユーザーがLLMのガイダンスを求めること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life はコメントを受け付けていません

PAPILLON: Efficient and Stealthy Fuzz Testing-Powered Jailbreaks for LLMs

要約 大規模言語モデル(LLM)は、様々なタスクにおいて優れているが、攻撃者が有 … 続きを読む

カテゴリー: cs.AI, cs.CR | PAPILLON: Efficient and Stealthy Fuzz Testing-Powered Jailbreaks for LLMs はコメントを受け付けていません

Will AI replace Software Engineers? Do not hold your breath

要約 大規模言語モデル(LLM)のような人工知能(AI)技術は、コードを作成する … 続きを読む

カテゴリー: cs.AI, cs.SE | Will AI replace Software Engineers? Do not hold your breath はコメントを受け付けていません

Inference Scaling Laws: An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models

要約 大規模言語モデル(LLM)学習のスケーリング則は広く研究されているが、LL … 続きを読む

カテゴリー: cs.AI | Inference Scaling Laws: An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models はコメントを受け付けていません

Deep Learning-Driven Malware Classification with API Call Sequence Analysis and Concept Drift Handling

要約 動的な環境におけるマルウェア分類は、マルウェアデータの統計的特性が時間と共 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Deep Learning-Driven Malware Classification with API Call Sequence Analysis and Concept Drift Handling はコメントを受け付けていません

ReFocus: Reinforcing Mid-Frequency and Key-Frequency Modeling for Multivariate Time Series Forecasting

要約 最近の進歩により、ディープラーニングモデルに周波数ベースの技術が徐々に組み … 続きを読む

カテゴリー: cs.AI, cs.LG | ReFocus: Reinforcing Mid-Frequency and Key-Frequency Modeling for Multivariate Time Series Forecasting はコメントを受け付けていません

Enhancing Large Language Models with Pseudo- and Multisource- Knowledge Graphs for Open-ended Question Answering

要約 大規模言語モデルの幻覚を軽減することは極めて重要な課題である。既存の手法の … 続きを読む

カテゴリー: cs.AI, cs.CL | Enhancing Large Language Models with Pseudo- and Multisource- Knowledge Graphs for Open-ended Question Answering はコメントを受け付けていません