cs.AI」カテゴリーアーカイブ

All You Need is Sally-Anne: ToM in AI Strongly Supported After Surpassing Tests for 3-Year-Olds

要約 心の理論(トム)は人間の認知の特徴であり、個人が他人の信念と意図について推 … 続きを読む

カテゴリー: cs.AI | All You Need is Sally-Anne: ToM in AI Strongly Supported After Surpassing Tests for 3-Year-Olds はコメントを受け付けていません

PAARS: Persona Aligned Agentic Retail Shoppers

要約 eコマースでは、コストと遅い可能性のある意思決定のために行動データが収集さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MA | PAARS: Persona Aligned Agentic Retail Shoppers はコメントを受け付けていません

What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

要約 「テスト時間コンピューティング」とも呼ばれるテスト時間スケーリング(TTS … 続きを読む

カテゴリー: cs.AI, cs.CL | What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models はコメントを受け付けていません

Spatio-temporal Prediction of Fine-Grained Origin-Destination Matrices with Applications in Ridesharing

要約 ネットワークベースの旅行者の要求の正確な空間的予測は、ライドシェアリングプ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Spatio-temporal Prediction of Fine-Grained Origin-Destination Matrices with Applications in Ridesharing はコメントを受け付けていません

Inductive Moment Matching

要約 拡散モデルとフローマッチングは、高品質のサンプルを生成しますが、推論では遅 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Inductive Moment Matching はコメントを受け付けていません

CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection

要約 特に重要なソフトウェアコンポーネントでは、ソースコードの脆弱性を特定するこ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.SE | CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection はコメントを受け付けていません

New Statistical Framework for Extreme Error Probability in High-Stakes Domains for Reliable Machine Learning

要約 機械学習はハイステークスドメインでは不可欠ですが、従来の検証方法は、極端な … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ME, stat.ML | New Statistical Framework for Extreme Error Probability in High-Stakes Domains for Reliable Machine Learning はコメントを受け付けていません

Evaluating and Designing Sparse Autoencoders by Approximating Quasi-Orthogonality

要約 スパースオートエンコーダー(SAE)は、現代の機械的解釈可能性の主力として … 続きを読む

カテゴリー: cs.AI, cs.LG | Evaluating and Designing Sparse Autoencoders by Approximating Quasi-Orthogonality はコメントを受け付けていません

AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World

要約 スケーラブルで再現可能なポリシー評価は、ロボット学習における長年の課題でし … 続きを読む

カテゴリー: cs.AI, cs.RO | AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World はコメントを受け付けていません

PharmAgents: Building a Virtual Pharma with Large Language Model Agents

要約 新規の小分子薬の発見は、疾患の治療と人間の健康の進歩に広範囲に及ぶ意味を持 … 続きを読む

カテゴリー: cs.AI, q-bio.BM | PharmAgents: Building a Virtual Pharma with Large Language Model Agents はコメントを受け付けていません