-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Better To Ask in English? Evaluating Factual Accuracy of Multilingual LLMs in English and Low-Resource Languages
要約 多言語の大規模な言語モデル(LLM)は、特に英語などの高リソース言語で、さ … 続きを読む
AutoJudge: Judge Decoding Without Manual Annotation
要約 Autojudgeを導入します。これは、タスク固有の損失の投機的デコードを … 続きを読む
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
要約 生成AI(2020-2023)の「Act I」と呼ばれる可能性のある大規模 … 続きを読む
Reconstructing Context: Evaluating Advanced Chunking Strategies for Retrieval-Augmented Generation
要約 検索された生成(RAG)は、外部の知識ソースに出力を接地することにより、大 … 続きを読む
Evaluation Framework for AI Systems in ‘the Wild’
要約 生成AI(genai)モデルは業界全体で重要になりましたが、現在の評価方法 … 続きを読む
NoisyHate: Mining Online Human-Written Perturbations for Realistic Robustness Benchmarking of Content Moderation Models
要約 有毒なコンテンツを持つオンラインテキストは、特にソーシャルメディアのユーザ … 続きを読む
TD-EVAL: Revisiting Task-Oriented Dialogue Evaluation by Combining Turn-Level Precision with Dialogue-Level Comparisons
要約 タスク指向のダイアログ(TOD)システムは、大規模な言語モデル(LLM)に … 続きを読む
Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations
要約 このペーパーでは、実際の知識の中で、時間的文脈の変動に対する言語モデル(L … 続きを読む
Repurposing the scientific literature with vision-language models
要約 主要なビジョン言語モデル(VLM)は、一般的なインターネットコンテンツにつ … 続きを読む