「cs.LG」カテゴリーアーカイブ

Learning to Price Homogeneous Data

投稿日: 2024年11月5日作成者: jarxiv

要約私たちは、販売者が $N$ の同種データポイント (例: あるディストリ … 続きを読む →

カテゴリー: cs.GT, cs.LG | コメントを受け付けていません

From Imitation to Refinement — Residual RL for Precise Assembly

投稿日: 2024年11月5日作成者: jarxiv

要約アクションのチャンク化や拡散などの動作クローニング (BC) の最近の進歩 … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Culinary Class Wars: Evaluating LLMs using ASH in Cuisine Transfer Task

投稿日: 2024年11月5日作成者: jarxiv

要約大規模言語モデル (LLM) の出現は、料理芸術を含むさまざまな創造的な領 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Online Adaptation of Language Models with a Memory of Amortized Contexts

投稿日: 2024年11月5日作成者: jarxiv

要約情報の生成と普及が速いため、大規模言語モデル (LLM) は、莫大な開発コ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Scalable Efficient Training of Large Language Models with Low-dimensional Projected Attention

投稿日: 2024年11月5日作成者: jarxiv

要約大規模言語モデル (LLM) の有効性と効率性を同時に改善することは、重要 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

BiVLC: Extending Vision-Language Compositionality Evaluation with Text-to-Image Retrieval

投稿日: 2024年11月5日作成者: jarxiv

要約 SugarCrepe のような既存の視覚言語構成性 (VLC) ベンチマー … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Regress, Don’t Guess — A Regression-like Loss on Number Tokens for Language Models

投稿日: 2024年11月5日作成者: jarxiv

要約言語モデルはテキスト生成において優れた能力を持っていますが、数値を出力する … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.CL, cs.LG, cs.MS | コメントを受け付けていません

TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training

投稿日: 2024年11月5日作成者: jarxiv

要約大規模言語モデル (LLM) の開発は、最先端の自然言語処理アプリケーショ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | コメントを受け付けていません

The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units

投稿日: 2024年11月5日作成者: jarxiv

要約大規模言語モデル (LLM) は、言語タスクだけでなく、論理的推論や社会的 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Sparsing Law: Towards Large Language Models with Greater Activation Sparsity

投稿日: 2024年11月5日作成者: jarxiv

要約アクティベーションの希薄性は、アクティベーション出力内に、除去できる寄与度 … 続きを読む →

カテゴリー: cs.CL, cs.LG, I.2.7, stat.ML | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Learning to Price Homogeneous Data

From Imitation to Refinement — Residual RL for Precise Assembly

Culinary Class Wars: Evaluating LLMs using ASH in Cuisine Transfer Task

Online Adaptation of Language Models with a Memory of Amortized Contexts

Scalable Efficient Training of Large Language Models with Low-dimensional Projected Attention

BiVLC: Extending Vision-Language Compositionality Evaluation with Text-to-Image Retrieval

Regress, Don’t Guess — A Regression-like Loss on Number Tokens for Language Models

TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training

The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units

Sparsing Law: Towards Large Language Models with Greater Activation Sparsity

最近の投稿

最近のコメント

アーカイブ

カテゴリー