-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
月別アーカイブ: 2024年2月
Faithful Temporal Question Answering over Heterogeneous Sources
要約 時間的質問応答 (QA) には、「… 2019 年に」や「… 新型コロナウ … 続きを読む
The Challenges of Machine Learning for Trust and Safety: A Case Study on Misinformation Detection
要約 私たちは、ケーススタディとして誤った情報の検出を使用して、機械学習を信頼と … 続きを読む
Towards Efficient and Exact Optimization of Language Model Alignment
要約 言語モデルを人間の好みに合わせることは、現実世界のタスクに言語モデルを適用 … 続きを読む
カテゴリー: cs.CL
Towards Efficient and Exact Optimization of Language Model Alignment はコメントを受け付けていません
PREDILECT: Preferences Delineated with Zero-Shot Language-based Reasoning in Reinforcement Learning
要約 好みに基づく強化学習 (RL) は、ロボット学習の新しい分野として登場しま … 続きを読む
Distilled Self-Critique of LLMs with Synthetic Data: a Bayesian Perspective
要約 この論文では、蒸留された自己批判 (dSC) を導入することにより、RLA … 続きを読む
Repetition Improves Language Model Embeddings
要約 自己回帰大規模言語モデル (LLM) からのテキスト埋め込みの抽出を改善す … 続きを読む
Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought Reasoning
要約 大規模言語モデル (LLM) は、質問に答える前に段階的に推論するよう求め … 続きを読む
カテゴリー: cs.CL
Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought Reasoning はコメントを受け付けていません
Leveraging Domain Knowledge for Efficient Reward Modelling in RLHF: A Case-Study in E-Commerce Opinion Summarization
要約 人間のフィードバックからの強化学習 (RLHF) は、言語モデル (LM) … 続きを読む
Prejudice and Caprice: A Statistical Framework for Measuring Social Discrimination in Large Language Models
要約 大規模言語モデル (LLM) の社会業務への統合が進むにつれて、経済、法律 … 続きを読む
Chain of Logic: Rule-Based Reasoning with Large Language Models
要約 法的推論の基本的なタイプであるルールに基づく推論では、一連の事実にルールを … 続きを読む
カテゴリー: cs.CL
Chain of Logic: Rule-Based Reasoning with Large Language Models はコメントを受け付けていません