-
最近の投稿
- MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering
- System 2 thinking in OpenAI’s o1-preview model: Near-perfect performance on a mathematics exam
- Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch
- How Good Are LLMs for Literary Translation, Really? Literary Translation Evaluation with Humans and LLMs
- GrammaMT: Improving Machine Translation with Grammar-Informed In-Context Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (28594) cs.CL (21619) cs.CR (2230) cs.CV (35201) cs.LG (33329) cs.RO (16476) cs.SY (2536) eess.IV (4287) eess.SY (2530) stat.ML (4469)
月別アーカイブ: 2024年6月
Beyond ELBOs: A Large-Scale Evaluation of Variational Methods for Sampling
要約 モンテカルロ法、変分推論、およびそれらの組み合わせは、扱いにくい確率分布か … 続きを読む
Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Forensics
要約 AI によって生成されたメディア コンテンツを指すディープフェイクは、偽情 … 続きを読む
Nash Learning from Human Feedback
要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む
Errors are Robustly Tamed in Cumulative Knowledge Processes
要約 私たちは、新しい知識単位の妥当性が、その導出の正確さと、それが依存する単位 … 続きを読む
GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning
要約 微分可能経済学では、深層学習を使用して自動メカニズム設計を行います。 大き … 続きを読む
Signature Kernel Conditional Independence Tests in Causal Discovery for Stochastic Processes
要約 観測データから確率力学システムの根底にある因果構造を推測することは、科学か … 続きを読む
Multi-Modal Automatic Prosody Annotation with Contrastive Pretraining of SSWP
要約 表現力豊かで制御可能な Text-to-Speech (TTS) では、明 … 続きを読む
Textual Similarity as a Key Metric in Machine Translation Quality Estimation
要約 機械翻訳 (MT) 品質評価 (QE) は、参考テキストなしで翻訳の信頼性 … 続きを読む
Formal Semantic Geometry over Transformer-based Variational AutoEncoder
要約 形式的/記号的セマンティクスは、\textit{localisation} … 続きを読む