月別アーカイブ: 2023年6月

Weakly-Supervised Scientific Document Classification via Retrieval-Augmented Multi-Stage Training

投稿日: 2023年6月13日作成者: jarxiv

要約科学文書の分類は幅広いアプリケーションにとって重要なタスクですが、人間がラ … 続きを読む →

カテゴリー: cs.CL, cs.IR | コメントを受け付けていません

A Survey of Vision-Language Pre-training from the Lens of Multimodal Machine Translation

投稿日: 2023年6月13日作成者: jarxiv

要約 BERT や GPT シリーズなどの大規模な言語モデルは、大規模なデータセ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LTCR: Long-Text Chinese Rumor Detection Dataset

投稿日: 2023年6月13日作成者: jarxiv

要約私たちが開発した長文中国の噂検出データセットは、噂検証の文脈における誤解を … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Adaptation Approaches for Nearest Neighbor Language Models

投稿日: 2023年6月13日作成者: jarxiv

要約セミパラメトリック最近傍言語モデル ($k$NN-LM) は、外部メモリ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Large-Batch, Neural Multi-Objective Bayesian Optimization

投稿日: 2023年6月13日作成者: jarxiv

要約ベイジアン最適化は、ブラックボックスで評価コストのかかる関数をグローバルに … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.LG | コメントを受け付けていません

Generating Language Corrections for Teaching Physical Control Tasks

投稿日: 2023年6月13日作成者: jarxiv

要約 AI 支援は、言語学習からインテリジェントな個別指導システムに至るまで、教 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.RO | コメントを受け付けていません

Mitigating Prior Errors in Causal Structure Learning: Towards LLM driven Prior Knowledge

投稿日: 2023年6月13日作成者: jarxiv

要約因果構造学習は、ベイジアンネットワーク (BN) を通じて変数間の原因と … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects

投稿日: 2023年6月13日作成者: jarxiv

要約このパースペクティブペーパーでは、対話の自動完了、知識とスタイルの伝達、 … 続きを読む →

カテゴリー: cs.AI, cs.CY | コメントを受け付けていません

Gradient Ascent Post-training Enhances Language Model Generalization

投稿日: 2023年6月13日作成者: jarxiv

要約この研究では、ラベルなしのランダムなテキストコーパスに対するわずか数ステ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SE-MoE: A Scalable and Efficient Mixture-of-Experts Distributed Training and Inference System

投稿日: 2023年6月13日作成者: jarxiv

要約現在、ML インフラストラクチャの多様性が増しており、大きなモデルの作成を … 続きを読む →

カテゴリー: cs.AI, cs.DC | コメントを受け付けていません

月別アーカイブ: 2023年6月

Weakly-Supervised Scientific Document Classification via Retrieval-Augmented Multi-Stage Training

A Survey of Vision-Language Pre-training from the Lens of Multimodal Machine Translation

LTCR: Long-Text Chinese Rumor Detection Dataset

Adaptation Approaches for Nearest Neighbor Language Models

Large-Batch, Neural Multi-Objective Bayesian Optimization

Generating Language Corrections for Teaching Physical Control Tasks

Mitigating Prior Errors in Causal Structure Learning: Towards LLM driven Prior Knowledge

Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects

Gradient Ascent Post-training Enhances Language Model Generalization

SE-MoE: A Scalable and Efficient Mixture-of-Experts Distributed Training and Inference System

最近の投稿

最近のコメント

アーカイブ

カテゴリー