-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
HR-Bandit: Human-AI Collaborated Linear Recourse Bandit
要約 人間の医師は、患者がより効果的な治療を受けるために症状を修正できるようにす … 続きを読む
カテゴリー: cs.LG
HR-Bandit: Human-AI Collaborated Linear Recourse Bandit はコメントを受け付けていません
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search
要約 大規模言語モデル (LLM) の計算コストが高いため、量子化、スパース化、 … 続きを読む
カテゴリー: cs.LG
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search はコメントを受け付けていません
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens
要約 言語モデルは多くの場合、トレーニング データセット内の過去のトークンが与え … 続きを読む
カテゴリー: cs.LG
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens はコメントを受け付けていません
Harnessing Causality in Reinforcement Learning With Bagged Decision Times
要約 袋詰めされた決定時間を持つ問題のクラスに対する強化学習 (RL) を検討し … 続きを読む
A Large Language Model-Driven Reward Design Framework via Dynamic Feedback for Reinforcement Learning
要約 大規模言語モデル (LLM) は、強化学習 (RL) タスクの報酬関数の設 … 続きを読む
カテゴリー: cs.LG
A Large Language Model-Driven Reward Design Framework via Dynamic Feedback for Reinforcement Learning はコメントを受け付けていません
Stochastic Gradient Descent Jittering for Inverse Problems: Alleviating the Accuracy-Robustness Tradeoff
要約 逆問題は、破損または摂動された測定値から目に見えないデータを再構築すること … 続きを読む
Decomposing The Dark Matter of Sparse Autoencoders
要約 スパース オートエンコーダ (SAE) は、言語モデルのアクティベーション … 続きを読む
カテゴリー: cs.LG
Decomposing The Dark Matter of Sparse Autoencoders はコメントを受け付けていません
Self-supervised contrastive learning performs non-linear system identification
要約 自己教師あり学習 (SSL) アプローチは、多くのタスクや領域で大きな成功 … 続きを読む
A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus
要約 自然言語推論 (NLI) は、文のペアの含意関係を認識するタスクであり、自 … 続きを読む
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
要約 モデル回答の検証可能性を確保することは、質問応答 (QA) ドメインにおけ … 続きを読む