「cs.LG」カテゴリーアーカイブ

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

投稿日: 2024年10月10日作成者: jarxiv

要約プロンプトは、人間が大規模言語モデル (LLM) と対話する主な方法として … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデル (LLM) のコンテキストウィンドウの拡張により、さま … 続きを読む →

カテゴリー: C.4, cs.AI, cs.DC, cs.LG | コメントを受け付けていません

Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training

投稿日: 2024年10月10日作成者: jarxiv

要約複数のタスクを完了できるジェネラリストの身体化エージェントを学習するには、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

投稿日: 2024年10月10日作成者: jarxiv

要約確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality

投稿日: 2024年10月10日作成者: jarxiv

要約 Fr\’echet Video Distance (FVD) … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks

投稿日: 2024年10月10日作成者: jarxiv

要約好みの最適化 (PO) は、言語モデルを人間の望ましい行動に合わせるための … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control

投稿日: 2024年10月10日作成者: jarxiv

要約 MPCはタイムステップごとに最適な制御問題を解くことで非線形フィードバック … 続きを読む →

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation

投稿日: 2024年10月10日作成者: jarxiv

要約都市環境における低電力無線ネットワークで低デューティサイクル動作を実現す … 続きを読む →

カテゴリー: cs.LG, cs.NI | コメントを受け付けていません

Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attacks

投稿日: 2024年10月10日作成者: jarxiv

要約機械の非学習は、LLM でのトレーニングデータの望ましくない記憶を軽減す … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Control-oriented Clustering of Visual Latent Representation

投稿日: 2024年10月10日作成者: jarxiv

要約私たちは、動作のクローン作成から学習した画像ベースの制御パイプラインにおけ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks

Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control

PAMLR: A Passive-Active Multi-Armed Bandit-Based Solution for LoRa Channel Allocation

Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attacks

Control-oriented Clustering of Visual Latent Representation

最近の投稿

最近のコメント

アーカイブ

カテゴリー