cs.LG」カテゴリーアーカイブ

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

要約 プロンプトは、人間が大規模言語モデル (LLM) と対話する主な方法として … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models はコメントを受け付けていません

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

要約 大規模言語モデル (LLM) のコンテキスト ウィンドウの拡張により、さま … 続きを読む

カテゴリー: C.4, cs.AI, cs.DC, cs.LG | LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management はコメントを受け付けていません

Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training

要約 複数のタスクを完了できるジェネラリストの身体化エージェントを学習するには、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training はコメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

要約 確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む

カテゴリー: cs.LG, math.OC | A Simulation-Free Deep Learning Approach to Stochastic Optimal Control はコメントを受け付けていません

Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality

要約 Fr\’echet Video Distance (FVD) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality はコメントを受け付けていません

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks

要約 好みの最適化 (PO) は、言語モデルを人間の望ましい行動に合わせるための … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks はコメントを受け付けていません

Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control

要約 MPCはタイムステップごとに最適な制御問題を解くことで非線形フィードバック … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control はコメントを受け付けていません

PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation

要約 都市環境における低電力無線ネットワークで低デューティ サイクル動作を実現す … 続きを読む

カテゴリー: cs.LG, cs.NI | PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation はコメントを受け付けていません

Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attacks

要約 機械の非学習は、LLM でのトレーニング データの望ましくない記憶を軽減す … 続きを読む

カテゴリー: cs.LG | Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attacks はコメントを受け付けていません

Control-oriented Clustering of Visual Latent Representation

要約 私たちは、動作のクローン作成から学習した画像ベースの制御パイプラインにおけ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Control-oriented Clustering of Visual Latent Representation はコメントを受け付けていません