-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
月別アーカイブ: 2023年9月
DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models
要約 自動運転の最近の進歩はデータ駆動型のアプローチに依存しており、広く採用され … 続きを読む
At Which Training Stage Does Cocde Data Help LLMs Reasoning?
要約 大規模言語モデル (LLM) は、顕著な推論能力を発揮し、言語テクノロジの … 続きを読む
カテゴリー: cs.CL
At Which Training Stage Does Cocde Data Help LLMs Reasoning? はコメントを受け付けていません
Corrections of Zipf’s and Heaps’ Laws Derived from Hapax Rate Models
要約 この記事では、hapax レートの体系的なモデルに基づいた Zipf の法 … 続きを読む
Intrinsic Language-Guided Exploration for Complex Long-Horizon Robotic Manipulation Tasks
要約 現在の強化学習アルゴリズムは、まばらで複雑な環境、特に多数の異なるシーケン … 続きを読む
Human Feedback is not Gold Standard
要約 人間によるフィードバックは、大規模言語モデルのパフォーマンスを評価するため … 続きを読む
カテゴリー: cs.CL
Human Feedback is not Gold Standard はコメントを受け付けていません
Transformer-VQ: Linear-Time Transformers via Vector Quantization
要約 線形時間でソフトマックスベースの高密度セルフアテンションを計算するデコーダ … 続きを読む
A Comprehensive Survey of Document-level Relation Extraction (2016-2022)
要約 文書レベルの関係抽出 (DocRE) は、文の境界を越えたエンティティ間の … 続きを読む
Unsupervised Fact Verification by Language Model Distillation
要約 教師なし事実検証は、いかなる種類のデータ注釈も付けずに、信頼できる知識ベー … 続きを読む
A novel approach to measuring patent claim scope based on probabilities obtained from (large) language models
要約 この研究は、特許請求の範囲を、この請求の範囲に含まれる自己情報の逆数として … 続きを読む
A Benchmark for Learning to Translate a New Language from One Grammar Book
要約 大規模言語モデル (LLM) は、コンテキスト内学習または軽量の微調整によ … 続きを読む
カテゴリー: cs.CL
A Benchmark for Learning to Translate a New Language from One Grammar Book はコメントを受け付けていません