All the World’s a (Hyper)Graph: A Data Drama

要約

シェークスピアの戯曲から派生した多様なリレーショナル データ表現のデータセットである Hyperbard を紹介します。
私たちの表現は、単一シーンでのキャラクターの同時出現をキャプチャする単純なグラフから、複雑な通信設定とキャラクターの寄与をエッジ固有のノード重みを持つハイパーエッジとしてエンコードするハイパーグラフまで多岐にわたります。
複数の直観的な表現を実験にすぐに利用できるようにすることで、グラフ学習、グラフマイニング、ネットワーク分析における厳密な表現の堅牢性チェックが容易になり、特定の表現の長所と短所が強調されます。
Hyperbard でリリースされたデータを活用して、一般的なグラフ マイニングの問題に対する多くの解決策が表現の選択に大きく依存していることを実証し、したがって現在のグラフ キュレーションの実践に疑問を投げかけています。
私たちのデータソースへのオマージュとして、そして科学は芸術にもなり得ると主張するために、私たちはすべてのポイントを演劇の形で提示します。

要約(オリジナル)

We introduce Hyperbard, a dataset of diverse relational data representations derived from Shakespeare’s plays. Our representations range from simple graphs capturing character co-occurrence in single scenes to hypergraphs encoding complex communication settings and character contributions as hyperedges with edge-specific node weights. By making multiple intuitive representations readily available for experimentation, we facilitate rigorous representation robustness checks in graph learning, graph mining, and network analysis, highlighting the advantages and drawbacks of specific representations. Leveraging the data released in Hyperbard, we demonstrate that many solutions to popular graph mining problems are highly dependent on the representation choice, thus calling current graph curation practices into question. As an homage to our data source, and asserting that science can also be art, we present all our points in the form of a play.

arxiv情報

著者 Corinna Coupette,Jilles Vreeken,Bastian Rieck
発行日 2023-12-06 08:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.LG, cs.SI パーマリンク