タイトル:あなたの地域で何が起こっているのか? 地域ニュースを検出するための弱学習アプローチ
– 地域ニュース記事は、市、県または州などの地理的領域に影響を与えるニュースのサブセットです。
– 正確な地域ニュースの推奨に向けて、地域ニュースの検出(ステップ1)およびその後のその地理的位置と影響半径の決定(ステップ2)は、2つの重要なステップです。
– 最新の自然言語処理の発展により、自動地域ニュース検出およびコンテンツベースの地域ニュース推奨を可能にする統合パイプラインを開発します。
– この論文では、パイプラインのステップ1に焦点を当てており、以下を強調しています。
1. ドメイン知識と自動データ処理が組み込まれた弱学習フレームワーク
2. 多言語設定への拡張性
– 実世界での人手によるラベル付けデータセットで評価した精度と再現率の観点から、Stanford CoreNLP NERモデルに比べて、私たちのパイプラインは高い精度と再現率を持っています。
– このパイプラインは、ユーザーにより正確な地域ニュースを提供し、地元企業の露出を高め、人々に彼らの地域の安全性に関する情報を提供することができる可能性があります。
Local news articles are a subset of news that impact users in a geographical area, such as a city, county, or state. Detecting local news (Step 1) and subsequently deciding its geographical location as well as radius of impact (Step 2) are two important steps towards accurate local news recommendation. Naive rule-based methods, such as detecting city names from the news title, tend to give erroneous results due to lack of understanding of the news content. Empowered by the latest development in natural language processing, we develop an integrated pipeline that enables automatic local news detection and content-based local news recommendations. In this paper, we focus on Step 1 of the pipeline, which highlights: (1) a weakly supervised framework incorporated with domain knowledge and auto data processing, and (2) scalability to multi-lingual settings. Compared with Stanford CoreNLP NER model, our pipeline has higher precision and recall evaluated on a real-world and human-labeled dataset. This pipeline has potential to more precise local news to users, helps local businesses get more exposure, and gives people more information about their neighborhood safety.
著者 | Deven Santosh Shah,Shiying He,Gosuddin Kamaruddin Siddiqi,Radhika Bansal |
発行日 | 2023-05-10 00:40:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI