-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints
要約 言語エージェントが重要なタスクをますます自動化するにつれて、ドメイン固有の … 続きを読む
Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets
要約 大規模な言語モデルは、タスクと知識のユーザー要求に応答して、さまざまな設定 … 続きを読む
From Bytes to Ideas: Language Modeling with Autoregressive U-Nets
要約 トークン化は、入力テキストに固定された粒度を課し、言語モデルがデータでどの … 続きを読む
A Variational Framework for Improving Naturalness in Generative Spoken Language Models
要約 テキスト処理における大規模な言語モデルの成功により、音声モデリングへの適応 … 続きを読む
Chain-of-Thought Reasoning In The Wild Is Not Always Faithful
要約 チェーンオブシャーチ(COT)の推論は、最先端のAI機能を大幅に進めていま … 続きを読む
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents
要約 マルチモーダル大手言語モデル(MLLMS)は、グラフィカルユーザーインター … 続きを読む
VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning
要約 蚊媒介性疾患は、大規模な世界的な健康リスクをもたらし、発生を防ぐために繁殖 … 続きを読む
ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities
要約 従来の固定テストセットは、基礎モデルのオープンエンド機能の評価に不足してい … 続きを読む
FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback
要約 科学的な視覚化と文書を理解するには、キャプションが重要です。 科学者向けの … 続きを読む
Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models
要約 GPT-4などの大規模な言語モデル(LLM)は、複数のドメインにまたがる膨 … 続きを読む