月別アーカイブ: 2023年6月

Elixir: Train a Large Language Model on a Small GPU Cluster

投稿日: 2023年6月1日作成者: jarxiv

要約近年、大規模な言語モデルは、その前例のないサイズにより大きな成功を収めてい … 続きを読む →

カテゴリー: cs.AI, cs.DC, cs.LG | コメントを受け付けていません

Reverse Engineering Self-Supervised Learning

投稿日: 2023年6月1日作成者: jarxiv

要約自己教師あり学習 (SSL) は機械学習における強力なツールですが、学習さ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Handling Large Discrete Action Spaces via Dynamic Neighborhood Construction

投稿日: 2023年6月1日作成者: jarxiv

要約大規模な離散アクション空間は依然として強化学習手法の中心的な課題です。こ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Med-UniC: Unifying Cross-Lingual Medical Vision-Language Pre-Training by Diminishing Bias

投稿日: 2023年6月1日作成者: jarxiv

要約データの不足は、医療ビジョン言語事前トレーニング (VLP) の有効性にと … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Improving Expressivity of GNNs with Subgraph-specific Factor Embedded Normalization

投稿日: 2023年6月1日作成者: jarxiv

要約グラフニューラルネットワーク (GNN) は、グラフ構造データを処理す … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Data Augmentation Approaches for Source Code Models: A Survey

投稿日: 2023年6月1日作成者: jarxiv

要約多くの重要なタスクでソースコードを採用することがますます一般的になり、ト … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

Personalized Algorithmic Recourse with Preference Elicitation

投稿日: 2023年6月1日作成者: jarxiv

要約アルゴリズムリソース (AR) は、ユーザーが一度実行すると、望ましくな … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Representation-Driven Reinforcement Learning

投稿日: 2023年6月1日作成者: jarxiv

要約強化学習のための表現駆動型フレームワークを紹介します。ポリシーをその期待 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL

投稿日: 2023年6月1日作成者: jarxiv

要約最近、拡散モデルは、オフライン強化学習 (RL) におけるシーケンスモデ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

投稿日: 2023年6月1日作成者: jarxiv

要約この論文では、人間の選択によって引き起こされる一連の軌跡から、人間の根本的 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

月別アーカイブ: 2023年6月

Elixir: Train a Large Language Model on a Small GPU Cluster

Reverse Engineering Self-Supervised Learning

Handling Large Discrete Action Spaces via Dynamic Neighborhood Construction

Med-UniC: Unifying Cross-Lingual Medical Vision-Language Pre-Training by Diminishing Bias

Improving Expressivity of GNNs with Subgraph-specific Factor Embedded Normalization

Data Augmentation Approaches for Source Code Models: A Survey

Personalized Algorithmic Recourse with Preference Elicitation

Representation-Driven Reinforcement Learning

MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

最近の投稿

最近のコメント

アーカイブ

カテゴリー