Tragic and Comical Networks. Clustering Dramatic Genres According to Structural Properties

要約

演劇の登場人物ネットワークから解釈を生み出す、ネットワーク研究と演劇史の共同分野での伝統が高まっています。このような解釈の可能性は、図を読むことと比べて、登場人物間の関係を図が異なる表現を提供することです。
テキストを書いたり、パフォーマンスを見たり。
私たちの目標は、ドラマの登場人物の数、つまりネットワークのサイズに依存せずに、解釈が容易で単純な劇の性質に基づいて、類似した構造を持つテキストをクラスター化できる方法を作成することです。
これらの特徴を見つけることは、私たちの研究の最も重要な部分であり、テキスト間の類似性を計算するための適切な統計手順を確立することでもあります。
データは DraCor データベースからダウンロードされ、R で分析されました (GerDracor と ShakeDraCor サブコレクションを使用します)。
文字間の単語の分布に基づく堅牢な方法を提案したいと考えています。
シーン内のキャラクターの分布、発話行為の平均の長さ、またはクラスター化係数やネットワーク密度などのキャラクター固有およびマクロレベルのネットワーク プロパティ。
これらのメトリクスに基づいて、サポート ベクター マシン (SVM) メソッドを使用して喜劇と悲劇を分類するために、教師付き分類手順がサブコレクションに適用されます。
私たちの研究は、このアプローチが小さなサンプルサイズでも信頼できる結果を生み出すことができることを示しています。

要約(オリジナル)

There is a growing tradition in the joint field of network studies and drama history that produces interpretations from the character networks of the plays.The potential of such an interpretation is that the diagrams provide a different representation of the relationships between characters as compared to reading the text or watching the performance. Our aim is to create a method that is able to cluster texts with similar structures on the basis of the play’s well-interpretable and simple properties, independent from the number of characters in the drama, or in other words, the size of the network. Finding these features is the most important part of our research, as well as establishing the appropriate statistical procedure to calculate the similarities between the texts. Our data was downloaded from the DraCor database and analyzed in R (we use the GerDracor and the ShakeDraCor sub-collection). We want to propose a robust method based on the distribution of words among characters; distribution of characters in scenes, average length of speech acts, or character-specific and macro-level network properties such as clusterization coefficient and network density. Based on these metrics a supervised classification procedure is applied to the sub-collections to classify comedies and tragedies using the Support Vector Machine (SVM) method. Our research shows that this approach can also produce reliable results on a small sample size.

arxiv情報

著者 Szemes Botond,Vida Bence
発行日 2023-02-16 12:36:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク