-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
$FastDoc$: Domain-Specific Fast Continual Pre-training Technique using Document-Level Metadata and Taxonomy
要約 本論文では、$FastDoc$(Fast Continual Pre-tr … 続きを読む
Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts
要約 エキスパート並列は、スパースにゲートされたMoE(Mixture-of-E … 続きを読む
Nova: A Practical and Advanced Alignment
要約 経験的に検証された一連の高性能モデルで採用されている、実践的なアライメント … 続きを読む
Leveraging Large Language Models for Suicide Detection on Social Media with Limited Labels
要約 自殺念慮の頻度が増加していることから、早期発見と介入の重要性が浮き彫りにな … 続きを読む
Large Language Models as Efficient Reward Function Searchers for Custom-Environment Multi-Objective Reinforcement Learning
要約 複雑なカスタム環境と複数の要求を持つ強化学習(RL)タスクにおいて、効果的 … 続きを読む
When Large Language Models Meet Vector Databases: A Survey
要約 この調査では、急成長しているが急速に発展している研究分野である大規模言語モ … 続きを読む
IntraMix: Intra-Class Mixup Generation for Accurate Labels and Neighbors
要約 グラフ・ニューラル・ネットワーク(GNN)は、データ・ラベルから学習し、ノ … 続きを読む
Equitable Federated Learning with Activation Clustering
要約 フェデレーテッド・ラーニングは、多様なクライアント間のコラボレーションを取 … 続きを読む
InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling
要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の価値観 … 続きを読む
Long Term Memory: The Foundation of AI Self-Evolution
要約 GPTのような大規模言語モデル(LLM)は、膨大なデータセットで学習され、 … 続きを読む