要約
ディープラーニングは、大規模な非構造化テキストおよび画像データセットから構造化情報を代入するための強力な方法を提供します。
たとえば、経済学者は衛星画像から経済活動の存在を検出したり、ソーシャル メディア、議会記録、企業報告書で言及されているトピックや実体を測定したりしたいと考えるかもしれません。
このレビューではディープ ニューラル ネットワークを紹介し、分類器、回帰モデル、生成 AI、埋め込みモデルなどの手法を取り上げます。
アプリケーションには、分類、文書のデジタル化、記録のリンク、および大規模なテキストおよび画像コーパスのデータ探索方法が含まれます。
適切な方法を使用すると、ディープ ラーニング モデルは低コストで調整でき、数百万または数十億のデータ ポイントが関係する問題にも手頃な価格で拡張できます。このレビューには、使いやすいデモ ノートブック、ソフトウェア リソース、
技術的な詳細と追加のアプリケーションを提供するナレッジ ベース。
要約(オリジナル)
Deep learning provides powerful methods to impute structured information from large-scale, unstructured text and image datasets. For example, economists might wish to detect the presence of economic activity in satellite images, or to measure the topics or entities mentioned in social media, the congressional record, or firm filings. This review introduces deep neural networks, covering methods such as classifiers, regression models, generative AI, and embedding models. Applications include classification, document digitization, record linkage, and methods for data exploration in massive scale text and image corpora. When suitable methods are used, deep learning models can be cheap to tune and can scale affordably to problems involving millions or billions of data points.. The review is accompanied by a companion website, EconDL, with user-friendly demo notebooks, software resources, and a knowledge base that provides technical details and additional applications.
arxiv情報
著者 | Melissa Dell |
発行日 | 2024-11-13 15:25:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google