要約
人文科学における深層学習を容易にするために設計された、関連する形式主義とツールを備えたグラフ認識オートエンコーダー アンサンブル フレームワークを紹介します。
サブアーキテクチャを構成して人文学的領域と同型のモデルを生成することで、サブアーキテクチャの選択ごとに関数シグネチャを提供しながら解釈可能性を維持し、従来の研究者と計算の研究者の両方が確立された慣行を中断することなく共同作業できるようにします。
私たちは、アメリカ大西洋以後の奴隷貿易の歴史的研究に対する私たちのアプローチの実践的な応用を示し、いくつかの具体的な技術的貢献を行います。それは、新しいハイブリッドグラフ畳み込みオートエンコーダメカニズム、一般的なグラフトポロジのバッチポリシー、および特定の用途のためのマスキング技術です。
-ケース。
多様な領域の参加を拡大するためのフレームワークの有効性は、人文科学者との共同研究と機械学習文献から確立されたタスクの両方を含む、さまざまな分野やデータ様式にまたがる 24 件の研究からなる成長する一連の研究によって実証されています。
私たちは、いくつかの異なるアーキテクチャ上の選択肢のパフォーマンスを比較し、この研究の差し迫った次のステップに関する野心的なリストで結論付けています。
要約(オリジナル)
We introduce a graph-aware autoencoder ensemble framework, with associated formalisms and tooling, designed to facilitate deep learning for scholarship in the humanities. By composing sub-architectures to produce a model isomorphic to a humanistic domain we maintain interpretability while providing function signatures for each sub-architectural choice, allowing both traditional and computational researchers to collaborate without disrupting established practices. We illustrate a practical application of our approach to a historical study of the American post-Atlantic slave trade, and make several specific technical contributions: a novel hybrid graph-convolutional autoencoder mechanism, batching policies for common graph topologies, and masking techniques for particular use-cases. The effectiveness of the framework for broadening participation of diverse domains is demonstrated by a growing suite of two dozen studies, both collaborations with humanists and established tasks from machine learning literature, spanning a variety of fields and data modalities. We make performance comparisons of several different architectural choices and conclude with an ambitious list of imminent next steps for this research.
arxiv情報
著者 | Tom Lippincott |
発行日 | 2024-01-01 17:48:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google