-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Preble: Efficient Distributed Prompt Scheduling for LLM Serving
要約 大規模言語モデル(LLM)へのプロンプトは、単純なユーザへの質問を超えて進 … 続きを読む
Data Similarity-Based One-Shot Clustering for Multi-Task Hierarchical Federated Learning
要約 我々は、ユーザが異なるタスクの学習に取り組む階層的連合学習環境におけるクラ … 続きを読む
OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable?
要約 分布シフトは様々な形で現れるため、分布外(OOD)汎化は困難である。多数の … 続きを読む
カテゴリー: cs.LG
OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable? はコメントを受け付けていません
An Online Automatic Modulation Classification Scheme Based on Isolation Distributional Kernel
要約 自動変調分類(AMC)は、現代の非協力的な通信ネットワークにおける重要な技 … 続きを読む
カテゴリー: cs.LG
An Online Automatic Modulation Classification Scheme Based on Isolation Distributional Kernel はコメントを受け付けていません
ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI
要約 知的な具現化エージェントは、長い経験の履歴を意思決定に統合することで、新し … 続きを読む
カテゴリー: cs.LG
ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI はコメントを受け付けていません
Forecasting Smog Clouds With Deep Learning
要約 この概念実証研究では、2地点間の二酸化窒素(NO2)、オゾン(O3)、(微 … 続きを読む
カテゴリー: cs.LG
Forecasting Smog Clouds With Deep Learning はコメントを受け付けていません
How to Train Long-Context Language Models (Effectively)
要約 我々は、ロングコンテクスト情報を効果的に利用するための言語モデル(LM)の … 続きを読む
Jailbreaking LLMs with Arabic Transliteration and Arabizi
要約 本研究では、「脱獄」攻撃に対する大規模言語モデル(LLM)の潜在的な脆弱性 … 続きを読む
On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization
要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む
Grounding Large Language Models In Embodied Environment With Imperfect World Models
要約 様々なアプリケーションで広く成功を収めているにもかかわらず、大規模言語モデ … 続きを読む