cs.LG」カテゴリーアーカイブ

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

要約 大規模言語モデル (LLM) 開発における主な課題は、膨大な事前トレーニン … 続きを読む

カテゴリー: cs.CL, cs.LG | A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs はコメントを受け付けていません

A Combinatorial Approach to Neural Emergent Communication

要約 深層学習ベースの創発通信に関する実質的な研究では、参照ゲーム フレームワー … 続きを読む

カテゴリー: cs.CL, cs.LG | A Combinatorial Approach to Neural Emergent Communication はコメントを受け付けていません

From Imitation to Introspection: Probing Self-Consciousness in Language Models

要約 自意識、つまり自分の存在と思考の内省は、高度な認知プロセスを表します。 言 … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | From Imitation to Introspection: Probing Self-Consciousness in Language Models はコメントを受け付けていません

GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning

要約 パラメータ効率の良い微調整 (PEFT) と検索拡張生成 (RAG) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning はコメントを受け付けていません

Provably Safe Neural Network Controllers via Differential Dynamic Logic

要約 ニューラル ネットワーク (NN) はサイバーフィジカル システムの自律コ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.LO, cs.SY, eess.SY | Provably Safe Neural Network Controllers via Differential Dynamic Logic はコメントを受け付けていません

From Efficiency to Equity: Measuring Fairness in Preference Learning

要約 AI システム、特に生成モデルが意思決定にますます影響を与えるようになるに … 続きを読む

カテゴリー: cs.AI, cs.LG | From Efficiency to Equity: Measuring Fairness in Preference Learning はコメントを受け付けていません

Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints

要約 バンディットにおける純粋な探索は、ハイパーパラメータの調整やユーザー調査の … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ME, stat.ML | Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints はコメントを受け付けていません

Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets

要約 我々は、アーベル群の推論タスク(例:モジュラー加算)で訓練された、二次活性 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, math.AC, math.RA | Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets はコメントを受け付けていません

Learning Mathematical Rules with Large Language Models

要約 この論文では、分布性や方程式の単純化などの特定の数学的規則を学習する大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Learning Mathematical Rules with Large Language Models はコメントを受け付けていません

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

要約 強化学習手法の大部分は、行動価値関数の効果的な推定値を取得するために必要な … 続きを読む

カテゴリー: cs.AI, cs.LG | Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning はコメントを受け付けていません