-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs
要約 大規模言語モデル (LLM) 開発における主な課題は、膨大な事前トレーニン … 続きを読む
A Combinatorial Approach to Neural Emergent Communication
要約 深層学習ベースの創発通信に関する実質的な研究では、参照ゲーム フレームワー … 続きを読む
From Imitation to Introspection: Probing Self-Consciousness in Language Models
要約 自意識、つまり自分の存在と思考の内省は、高度な認知プロセスを表します。 言 … 続きを読む
GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning
要約 パラメータ効率の良い微調整 (PEFT) と検索拡張生成 (RAG) は、 … 続きを読む
Provably Safe Neural Network Controllers via Differential Dynamic Logic
要約 ニューラル ネットワーク (NN) はサイバーフィジカル システムの自律コ … 続きを読む
From Efficiency to Equity: Measuring Fairness in Preference Learning
要約 AI システム、特に生成モデルが意思決定にますます影響を与えるようになるに … 続きを読む
Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints
要約 バンディットにおける純粋な探索は、ハイパーパラメータの調整やユーザー調査の … 続きを読む
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets
要約 我々は、アーベル群の推論タスク(例:モジュラー加算)で訓練された、二次活性 … 続きを読む
Learning Mathematical Rules with Large Language Models
要約 この論文では、分布性や方程式の単純化などの特定の数学的規則を学習する大規模 … 続きを読む
Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning
要約 強化学習手法の大部分は、行動価値関数の効果的な推定値を取得するために必要な … 続きを読む