-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Quality Estimation based Feedback Training for Improving Pronoun Translation
要約 代名詞の翻訳は、ニューラル機械翻訳 (NMT) における長年の課題であり、 … 続きを読む
Automating the Generation of Prompts for LLM-based Action Choice in PDDL Planning
要約 大規模言語モデル (LLM) は、さまざまな NLP タスクに革命をもたら … 続きを読む
Quantization Meets Reasoning: Exploring LLM Low-Bit Quantization Degradation for Mathematical Reasoning
要約 大規模な言語モデルは、MATH などの複雑な数学的推論ベンチマークで大幅な … 続きを読む
Decoupling Knowledge and Reasoning in Transformers: A Modular Architecture with Generalized Cross-Attention
要約 Transformer はさまざまな分野で目覚ましい成功を収めてきましたが … 続きを読む
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases
要約 大規模言語モデル (LLM) はさまざまな形でバイアスを示し、性別、人種、 … 続きを読む
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
要約 プロセス レベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities
要約 将来の出来事の予測は、情報に基づいた意思決定に不可欠な情報です。 機械学習 … 続きを読む
Are Your LLMs Capable of Stable Reasoning?
要約 大規模言語モデル (LLM) の急速な進歩により、複雑な推論タスクにおける … 続きを読む
The Two-Hop Curse: LLMs trained on A$\rightarrow$B, B$\rightarrow$C fail to learn A$\rightarrow$C
要約 [注意: このバージョンは古いです。 最近の研究はいくつかの重要な主張に矛 … 続きを読む