「cs.LG」カテゴリーアーカイブ

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

投稿日: 2024年10月25日作成者: jarxiv

要約大規模言語モデル (LLM) 開発における主な課題は、膨大な事前トレーニン … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

A Combinatorial Approach to Neural Emergent Communication

投稿日: 2024年10月25日作成者: jarxiv

要約深層学習ベースの創発通信に関する実質的な研究では、参照ゲームフレームワー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

From Imitation to Introspection: Probing Self-Consciousness in Language Models

投稿日: 2024年10月25日作成者: jarxiv

要約自意識、つまり自分の存在と思考の内省は、高度な認知プロセスを表します。言 … 続きを読む →

カテゴリー: cs.CL, cs.CY, cs.LG | コメントを受け付けていません

GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning

投稿日: 2024年10月25日作成者: jarxiv

要約パラメータ効率の良い微調整 (PEFT) と検索拡張生成 (RAG) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

Provably Safe Neural Network Controllers via Differential Dynamic Logic

投稿日: 2024年10月25日作成者: jarxiv

要約ニューラルネットワーク (NN) はサイバーフィジカルシステムの自律コ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.LO, cs.SY, eess.SY | コメントを受け付けていません

From Efficiency to Equity: Measuring Fairness in Preference Learning

投稿日: 2024年10月25日作成者: jarxiv

要約 AI システム、特に生成モデルが意思決定にますます影響を与えるようになるに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints

投稿日: 2024年10月25日作成者: jarxiv

要約バンディットにおける純粋な探索は、ハイパーパラメータの調整やユーザー調査の … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ME, stat.ML | コメントを受け付けていません

Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets

投稿日: 2024年10月25日作成者: jarxiv

要約我々は、アーベル群の推論タスク（例：モジュラー加算）で訓練された、二次活性 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, math.AC, math.RA | コメントを受け付けていません

Learning Mathematical Rules with Large Language Models

投稿日: 2024年10月25日作成者: jarxiv

要約この論文では、分布性や方程式の単純化などの特定の数学的規則を学習する大規模 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

投稿日: 2024年10月25日作成者: jarxiv

要約強化学習手法の大部分は、行動価値関数の効果的な推定値を取得するために必要な … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

A Combinatorial Approach to Neural Emergent Communication

From Imitation to Introspection: Probing Self-Consciousness in Language Models

GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning

Provably Safe Neural Network Controllers via Differential Dynamic Logic

From Efficiency to Equity: Measuring Fairness in Preference Learning

Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints

Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets

Learning Mathematical Rules with Large Language Models

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー