月別アーカイブ: 2023年6月

Weakly-Supervised Scientific Document Classification via Retrieval-Augmented Multi-Stage Training

要約 科学文書の分類は幅広いアプリケーションにとって重要なタスクですが、人間がラ … 続きを読む

カテゴリー: cs.CL, cs.IR | Weakly-Supervised Scientific Document Classification via Retrieval-Augmented Multi-Stage Training はコメントを受け付けていません

A Survey of Vision-Language Pre-training from the Lens of Multimodal Machine Translation

要約 BERT や GPT シリーズなどの大規模な言語モデルは、大規模なデータセ … 続きを読む

カテゴリー: cs.CL | A Survey of Vision-Language Pre-training from the Lens of Multimodal Machine Translation はコメントを受け付けていません

LTCR: Long-Text Chinese Rumor Detection Dataset

要約 私たちが開発した長文中国の噂検出データセットは、噂検証の文脈における誤解を … 続きを読む

カテゴリー: cs.CL | LTCR: Long-Text Chinese Rumor Detection Dataset はコメントを受け付けていません

Adaptation Approaches for Nearest Neighbor Language Models

要約 セミパラメトリック最近傍言語モデル ($k$NN-LM) は、外部メモリ … 続きを読む

カテゴリー: cs.CL | Adaptation Approaches for Nearest Neighbor Language Models はコメントを受け付けていません

Large-Batch, Neural Multi-Objective Bayesian Optimization

要約 ベイジアン最適化は、ブラックボックスで評価コストのかかる関数をグローバルに … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG | Large-Batch, Neural Multi-Objective Bayesian Optimization はコメントを受け付けていません

Generating Language Corrections for Teaching Physical Control Tasks

要約 AI 支援は、言語学習からインテリジェントな個別指導システムに至るまで、教 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.RO | Generating Language Corrections for Teaching Physical Control Tasks はコメントを受け付けていません

Mitigating Prior Errors in Causal Structure Learning: Towards LLM driven Prior Knowledge

要約 因果構造学習は、ベイジアン ネットワーク (BN) を通じて変数間の原因と … 続きを読む

カテゴリー: cs.AI, cs.LG | Mitigating Prior Errors in Causal Structure Learning: Towards LLM driven Prior Knowledge はコメントを受け付けていません

Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects

要約 このパースペクティブ ペーパーでは、対話の自動完了、知識とスタイルの伝達、 … 続きを読む

カテゴリー: cs.AI, cs.CY | Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects はコメントを受け付けていません

Gradient Ascent Post-training Enhances Language Model Generalization

要約 この研究では、ラベルなしのランダムなテキスト コーパスに対するわずか数ステ … 続きを読む

カテゴリー: cs.AI, cs.CL | Gradient Ascent Post-training Enhances Language Model Generalization はコメントを受け付けていません

SE-MoE: A Scalable and Efficient Mixture-of-Experts Distributed Training and Inference System

要約 現在、ML インフラストラクチャの多様性が増しており、大きなモデルの作成を … 続きを読む

カテゴリー: cs.AI, cs.DC | SE-MoE: A Scalable and Efficient Mixture-of-Experts Distributed Training and Inference System はコメントを受け付けていません