-
最近の投稿
- High-Dimensional Independence Testing via Maximum and Average Distance Correlations
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44172) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5744)
「cs.CL」カテゴリーアーカイブ
Assistant-Guided Mitigation of Teacher Preference Bias in LLM-as-a-Judge
要約 LLM-as-a-judgeは、GPT-4などの大規模な言語モデル(LLM … 続きを読む
Rubrik’s Cube: Testing a New Rubric for Evaluating Explanations on the CUBE dataset
要約 大規模な言語モデル(LLM)のパフォーマンスと使いやすさは、説明生成タスク … 続きを読む
DynaSaur: Large Language Agents Beyond Predefined Actions
要約 既存のLLMエージェントシステムは、通常、すべてのステップで固定および事前 … 続きを読む
Are Lexicon-Based Tools Still the Gold Standard for Valence Analysis in Low-Resource Flemish?
要約 日常言語のニュアンスを理解することは、計算言語学と感情の研究における進歩に … 続きを読む
Establishing Trustworthy LLM Evaluation via Shortcut Neuron Analysis
要約 大規模な言語モデル(LLMS)の開発は、信頼できる評価に依存します。 ただ … 続きを読む
Refining Sentence Embedding Model through Ranking Sentences Generation with Large Language Models
要約 文の埋め込みは、多くのNLPタスクに不可欠であり、NLIのような注釈付きデ … 続きを読む
Large Language Models Struggle to Describe the Haystack without Human Help: Human-in-the-loop Evaluation of Topic Models
要約 NLPの一般的な使用は、従来のトピックモデルの使用から大規模な言語モデルに … 続きを読む
A Dataset for Addressing Patient’s Information Needs related to Clinical Course of Hospitalization
要約 患者は、電子健康記録(EHR)からの臨床的証拠を使用して対処できる入院に関 … 続きを読む
Through the Prism of Culture: Evaluating LLMs’ Understanding of Indian Subcultures and Traditions
要約 大規模な言語モデル(LLM)は、顕著な進歩を示していますが、文化的偏見につ … 続きを読む
SkipGPT: Dynamic Layer Pruning Reinvented with Token Awareness and Module Decoupling
要約 大規模な言語モデル(LLM)は、タスク全体で顕著なパフォーマンスを実現しま … 続きを読む