-
最近の投稿
- Computing High-dimensional Confidence Sets for Arbitrary Distributions
- Reservoir Computing: A New Paradigm for Neural Networks
- A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model
- Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators
-
最近のコメント
表示できるコメントはありません。 cs.AI (36107) cs.CL (27319) cs.CR (2749) cs.CV (41949) cs.LG (41080) cs.RO (21304) cs.SY (3219) eess.IV (4921) eess.SY (3213) stat.ML (5380)
月別アーカイブ: 2025年4月
LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems
要約 フェルミ問題(FP)は、人間のような論理と数値推論を必要とする数学的推論課 … 続きを読む
Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole
要約 ギニアビサウ・クレオール語(Kiriol)の機械翻訳のための新しいデータセ … 続きを読む
The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context
要約 アライメントチューニングにより、大規模な言語モデルは推論、命令追従、有害な … 続きを読む
ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization
要約 近年の大規模言語モデル(LLM)の進歩により、人工知能の進歩が加速している … 続きを読む
Why do LLMs attend to the first token?
要約 大規模言語モデル(LLM)は、シーケンスの最初のトークンに集中する傾向があ … 続きを読む
Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study
要約 大規模言語モデル(LLM)は入力の摂動に対して非常に脆弱である。LLMのロ … 続きを読む
Measuring Large Language Models Capacity to Annotate Journalistic Sourcing
要約 2022年後半にChatGPTが発表されて以来、大規模言語モデルの能力とそ … 続きを読む
MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs
要約 101の言語、6つの言語現象をカバーし、125,000以上のミニマルペアを … 続きを読む
A Framework for Robust Cognitive Evaluation of LLMs
要約 大規模言語モデル(LLM)における創発的な認知能力は広く観察されているが、 … 続きを読む
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models
要約 予測モデルは、実世界のタスクにおいてしばしば不完全な情報を扱う必要がある。 … 続きを読む