-
最近の投稿
- FlowBotHD: History-Aware Diffuser Handling Ambiguities in Articulated Objects Manipulation
- A Novel Twisted-Winching String Actuator for Robotic Applications: Design and Validation
- Affordance-Centric Policy Learning: Sample Efficient and Generalisable Robot Policy Learning using Affordance-Centric Task Frames
- Sample-Efficient Reinforcement Learning with Temporal Logic Objectives: Leveraging the Task Specification to Guide Exploration
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (28198) cs.CL (21301) cs.CR (2201) cs.CV (34856) cs.LG (32941) cs.RO (16224) cs.SY (2500) eess.IV (4250) eess.SY (2494) stat.ML (4412)
月別アーカイブ: 2024年6月
Benchmarking of LLM Detection: Comparing Two Competing Approaches
要約 この記事では、LLM テキスト認識の分野の概要を説明します。 LLM で生 … 続きを読む
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models
要約 大規模言語モデル (LLM) は、特にデータが限られた下流のドメイン固有の … 続きを読む
R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models
要約 大規模な言語モデルは、一般的な NLP タスクでは目覚ましい成功を収めてい … 続きを読む
Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack
要約 大規模言語モデル (LLM) はさまざまなドメインにますます適用されており … 続きを読む
The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation
要約 この論文では、一次関数近似を使用したオフライン RL 問題を研究します。 … 続きを読む
t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making
要約 ディープジェネレーティブリプレイは、意思決定タスクにおける継続的な学習のた … 続きを読む
Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs
要約 言語モデル プログラム、つまりモジュール言語モデル (LM) 呼び出しの洗 … 続きを読む
Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale
要約 構文言語モデル (SLM) は、左から右の方法で構文ツリーを含む文を増分的 … 続きを読む
Nemotron-4 340B Technical Report
要約 Nemotron-4-340B-Base、Nemotron-4-340B- … 続きを読む
Refusal in Language Models Is Mediated by a Single Direction
要約 会話型の大規模言語モデルは、指示への従うことと安全性の両方を考慮して微調整 … 続きを読む