Characterizing LLM-driven Social Network: The Chirper.ai Case

要約

大規模な言語モデル(LLMS)は、人間の意思決定プロセスをシミュレートする能力を実証し、オフラインとオンラインの両方で洗練されたソーシャルネットワークをモデリングするエージェントとしての使用を可能にします。
最近の研究では、シミュレートされたネットワーク内のLLMエージェントの集合的な行動パターンと構造的特性を調査しました。
ただし、LLM駆動型と人間主導のオンラインソーシャルネットワークとの経験的比較は依然として不足しており、LLMエージェントが人間のユーザーとどのように異なるかについての理解を制限しています。
このペーパーでは、65,000人以上のエージェントと770万人のAI生成ポストを含むLLMエージェントが完全に住んでいるX/TwitterのようなソーシャルネットワークであるChirper.AIの大規模な分析を紹介します。
比較のために、人間主導の分散型ソーシャルネットワークであるMastodonから並列データセットを収集し、117,000人以上のユーザーと1600万人のポストを収集します。
LLMエージェントと人間の間の重要な違いを調べ、行動、虐待的なコンテンツ、ソーシャルネットワーク構造を投稿します。
私たちの調査結果は、AI時代のオンラインソーシャルネットワーク分析の進化する状況に関する重要な洞察を提供し、ソーシャルシミュレーションにおけるLLMエージェントの包括的なプロファイルを提供します。

要約(オリジナル)

Large language models (LLMs) demonstrate the ability to simulate human decision-making processes, enabling their use as agents in modeling sophisticated social networks, both offline and online. Recent research has explored collective behavioral patterns and structural characteristics of LLM agents within simulated networks. However, empirical comparisons between LLM-driven and human-driven online social networks remain scarce, limiting our understanding of how LLM agents differ from human users. This paper presents a large-scale analysis of Chirper.ai, an X/Twitter-like social network entirely populated by LLM agents, comprising over 65,000 agents and 7.7 million AI-generated posts. For comparison, we collect a parallel dataset from Mastodon, a human-driven decentralized social network, with over 117,000 users and 16 million posts. We examine key differences between LLM agents and humans in posting behaviors, abusive content, and social network structures. Our findings provide critical insights into the evolving landscape of online social network analysis in the AI era, offering a comprehensive profile of LLM agents in social simulations.

arxiv情報

著者 Yiming Zhu,Yupeng He,Ehsan-Ul Haq,Gareth Tyson,Pan Hui
発行日 2025-04-14 14:53:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SI | Characterizing LLM-driven Social Network: The Chirper.ai Case はコメントを受け付けていません

Predict+Optimize Problem in Renewable Energy Scheduling

要約

予測+最適化フレームワークは、予測と最適化を統合して、変動性と不確実性が重要な要因である再生可能エネルギーのスケジューリングなどの実際の課題に対処します。
このペーパーベンチマークは、再生可能エネルギーのスケジューリングの予測+最適化に関するIEEE技術的課題からのソリューション、再生可能な生産と需要の予測とエネルギーコストの最適化に焦点を当てています。
この競争には、合計で49人の参加者が集まりました。
トップランクの方法では、LightGBMアンサンブルを使用した確率的最適化を採用し、決定論的アプローチと比較して少なくとも2%のエネルギーコストの削減を達成しました。
公開されたデータと問題の設定は、エネルギーシステムの統合予測最適化方法をさらに調査するためのベンチマークを確立し、費用対効果の高い信頼できるエネルギー管理を実現する最適化モデルの予測不確実性を考慮することの重要性を強調しています。
この作業の斬新さは、実世界の再生可能エネルギースケジューリングの問題に適用される予測+最適化方法論の包括的な評価にあり、提案されたソリューションのスケーラビリティ、一般化、および有効性に関する洞察を提供します。
潜在的なアプリケーションは、エネルギーシステムを超えて、サプライチェーンの管理、輸送計画、財務ポートフォリオの最適化など、統合予測と最適化を必要とする任意のドメインに拡張します。

要約(オリジナル)

Predict+Optimize frameworks integrate forecasting and optimization to address real-world challenges such as renewable energy scheduling, where variability and uncertainty are critical factors. This paper benchmarks solutions from the IEEE-CIS Technical Challenge on Predict+Optimize for Renewable Energy Scheduling, focusing on forecasting renewable production and demand and optimizing energy cost. The competition attracted 49 participants in total. The top-ranked method employed stochastic optimization using LightGBM ensembles, and achieved at least a 2% reduction in energy costs compared to deterministic approaches, demonstrating that the most accurate point forecast does not necessarily guarantee the best performance in downstream optimization. The published data and problem setting establish a benchmark for further research into integrated forecasting-optimization methods for energy systems, highlighting the importance of considering forecast uncertainty in optimization models to achieve cost-effective and reliable energy management. The novelty of this work lies in its comprehensive evaluation of Predict+Optimize methodologies applied to a real-world renewable energy scheduling problem, providing insights into the scalability, generalizability, and effectiveness of the proposed solutions. Potential applications extend beyond energy systems to any domain requiring integrated forecasting and optimization, such as supply chain management, transportation planning, and financial portfolio optimization.

arxiv情報

著者 Christoph Bergmeir,Frits de Nijs,Evgenii Genov,Abishek Sriramulu,Mahdi Abolghasemi,Richard Bean,John Betts,Quang Bui,Nam Trong Dinh,Nils Einecke,Rasul Esmaeilbeigi,Scott Ferraro,Priya Galketiya,Robert Glasgow,Rakshitha Godahewa,Yanfei Kang,Steffen Limmer,Luis Magdalena,Pablo Montero-Manso,Daniel Peralta,Yogesh Pipada Sunil Kumar,Alejandro Rosales-Pérez,Julian Ruddick,Akylas Stratigakos,Peter Stuckey,Guido Tack,Isaac Triguero,Rui Yuan
発行日 2025-04-14 15:09:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Predict+Optimize Problem in Renewable Energy Scheduling はコメントを受け付けていません

Machine Learning and Transformers for Thyroid Carcinoma Diagnosis: A Review

要約

医療専門家が不治の疾患を治療するための広範なデータを処理するのを支援するスマート診断システムの開発に関心が高まっていることが注目に値します。
特に、甲状腺がん(TC)を特定するという課題は、機械学習(ML)とビッグデータ分析の使用とともに進歩を遂げ、トランスを取り入れてTCの予後を評価し、個人の悪性腫瘍のリスクを判断します。
このレビュー記事では、TCを診断するためのAIベースのアプローチ、特にトランスを採用しているアプローチに関するさまざまな研究の要約を紹介します。
人工知能(AI)アルゴリズム、フレームワークの目標、および使用されるコンピューティング環境に基づいて、これらの方法の新しい分類システムを導入します。
さらに、利用可能なTCデータセットをその機能で精査して対比します。
この論文は、医療診断と疾患管理におけるトランスと大規模な言語モデル(LLM)の継続的な重要性に特に焦点を当てた、監督者、監視なし、または混合アプローチを介したTCの診断と治療を支援する際のAI機器の重要性を強調しています。
さらに、この分野の進捗状況と継続的な障害について説明します。
最後に、将来の方向を探求し、この研究分野に焦点を当てています。

要約(オリジナル)

The growing interest in developing smart diagnostic systems to help medical experts process extensive data for treating incurable diseases has been notable. In particular, the challenge of identifying thyroid cancer (TC) has seen progress with the use of machine learning (ML) and big data analysis, incorporating Transformers to evaluate TC prognosis and determine the risk of malignancy in individuals. This review article presents a summary of various studies on AI-based approaches, especially those employing Transformers, for diagnosing TC. It introduces a new categorization system for these methods based on artificial intelligence (AI) algorithms, the goals of the framework, and the computing environments used. Additionally, it scrutinizes and contrasts the available TC datasets by their features. The paper highlights the importance of AI instruments in aiding the diagnosis and treatment of TC through supervised, unsupervised, or mixed approaches, with a special focus on the ongoing importance of Transformers and large language models (LLMs) in medical diagnostics and disease management. It further discusses the progress made and the continuing obstacles in this area. Lastly, it explores future directions and focuses within this research field.

arxiv情報

著者 Yassine Habchi,Hamza Kheddar,Yassine Himeur,Mohamed Chahine Ghanem
発行日 2025-04-14 15:10:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.IV | Machine Learning and Transformers for Thyroid Carcinoma Diagnosis: A Review はコメントを受け付けていません

AutoStyle-TTS: Retrieval-Augmented Generation based Automatic Style Matching Text-to-Speech Synthesis

要約

音声合成技術の進歩により、ユーザーは合成された音声の自然性と表現力に対する期待が高くなります。
しかし、以前の研究では、迅速な選択の重要性を無視しています。
この研究では、検索された生成(RAG)テクノロジーに基づいたテキストツーチー(TTS)フレームワークを提案します。これは、テキストコンテンツに従って音声スタイルを動的に調整して、より自然で鮮明なコミュニケーション効果を実現できます。
さまざまなコンテキストで高品質の音声サンプルを含む音声スタイルの知識データベースを構築し、スタイルマッチングスキームを開発しました。
このスキームでは、Llama、Per-llm-embedder、およびMokaによって抽出された埋め込みを使用して、知識データベースのサンプルと一致し、合成に最も適切な音声スタイルを選択します。
さらに、私たちの経験的研究は、提案された方法の有効性を検証します。
私たちのデモは、https://thuhcsi.github.io/icme2025-autostyle-ttsで見ることができます

要約(オリジナル)

With the advancement of speech synthesis technology, users have higher expectations for the naturalness and expressiveness of synthesized speech. But previous research ignores the importance of prompt selection. This study proposes a text-to-speech (TTS) framework based on Retrieval-Augmented Generation (RAG) technology, which can dynamically adjust the speech style according to the text content to achieve more natural and vivid communication effects. We have constructed a speech style knowledge database containing high-quality speech samples in various contexts and developed a style matching scheme. This scheme uses embeddings, extracted by Llama, PER-LLM-Embedder,and Moka, to match with samples in the knowledge database, selecting the most appropriate speech style for synthesis. Furthermore, our empirical research validates the effectiveness of the proposed method. Our demo can be viewed at: https://thuhcsi.github.io/icme2025-AutoStyle-TTS

arxiv情報

著者 Dan Luo,Chengyuan Ma,Weiqin Li,Jun Wang,Wei Chen,Zhiyong Wu
発行日 2025-04-14 15:18:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD | AutoStyle-TTS: Retrieval-Augmented Generation based Automatic Style Matching Text-to-Speech Synthesis はコメントを受け付けていません

Motion Control in Multi-Rotor Aerial Robots Using Deep Reinforcement Learning

要約

このペーパーでは、添加剤のドローン(AM)のモーションコントロールの課題に対処するために、ディープ補強材(DRL)学習の適用を調査します。
ドローンベースの添加剤製造は、大規模または危険な環境で柔軟で自律的な材料の堆積を約束します。
ただし、さまざまなペイロードと潜在的な障害の下で、マルチローターの空中ロボットの堅牢なリアルタイム制御を達成することは依然として困難です。
PIDのような従来のコントローラーは、多くの場合、頻繁にパラメーターを再調整する必要があり、動的シナリオでの適用性を制限します。
AMタスクでウェイポイントナビゲーションを実行するマルチロータードローンの適応可能な制御ポリシーを学習するDRLフレームワークを提案します。
深い決定論的ポリシーグラデーション(DDPG)とツインの遅延により、複雑さの増加を処理するように設計されたカリキュラム学習スキーム内で、深い決定論的ポリシー勾配(TD3)を比較します。
私たちの実験では、TD3が一貫してトレーニングの安定性、精度、および成功をバランスさせていることが示されています。特に、質量のばらつきが導入された場合です。
これらの発見は、添加剤の製造における堅牢で自律的なドローン制御へのスケーラブルなパスを提供します。

要約(オリジナル)

This paper investigates the application of Deep Reinforcement (DRL) Learning to address motion control challenges in drones for additive manufacturing (AM). Drone-based additive manufacturing promises flexible and autonomous material deposition in large-scale or hazardous environments. However, achieving robust real-time control of a multi-rotor aerial robot under varying payloads and potential disturbances remains challenging. Traditional controllers like PID often require frequent parameter re-tuning, limiting their applicability in dynamic scenarios. We propose a DRL framework that learns adaptable control policies for multi-rotor drones performing waypoint navigation in AM tasks. We compare Deep Deterministic Policy Gradient (DDPG) and Twin Delayed Deep Deterministic Policy Gradient (TD3) within a curriculum learning scheme designed to handle increasing complexity. Our experiments show TD3 consistently balances training stability, accuracy, and success, particularly when mass variability is introduced. These findings provide a scalable path toward robust, autonomous drone control in additive manufacturing.

arxiv情報

著者 Gaurav Shetty,Mahya Ramezani,Hamed Habibi,Holger Voos,Jose Luis Sanchez-Lopez
発行日 2025-04-14 15:22:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Motion Control in Multi-Rotor Aerial Robots Using Deep Reinforcement Learning はコメントを受け付けていません

AlayaDB: The Data Foundation for Efficient and Effective Long-context LLM Inference

要約

AlayAdbは、AlayAdB AIの大規模な言語モデル(LLMS)に対して効率的かつ効果的な長いコンテキスト推論のためにネイティブにアーキテクチャ化された最先端のベクトルデータベースシステムです。
具体的には、LLM推論システムからのKVキャッシュと注意計算を切り離し、それらを新しいベクトルデータベースシステムにカプセル化します。
サービスプロバイダー(MAAS)としてのモデルの場合、AlayAdbはハードウェアリソースを消費し、さまざまな種類のサービスレベル目標(SLO)を備えたさまざまなワークロード(SLO)でより高い世代の品質を提供します。
AlayAdBの核心は、LLM推論の注意計算とキャッシュ管理をクエリ処理手順に抽象化し、ネイティブクエリオプティマイザーを介してパフォーマンスを最適化することです。
この作業では、(i)業界パートナーからの3つのユースケース、および(ii)LLM推論ベンチマークに関する広範な実験結果を介してAlayadbの有効性を実証します。

要約(オリジナル)

AlayaDB is a cutting-edge vector database system natively architected for efficient and effective long-context inference for Large Language Models (LLMs) at AlayaDB AI. Specifically, it decouples the KV cache and attention computation from the LLM inference systems, and encapsulates them into a novel vector database system. For the Model as a Service providers (MaaS), AlayaDB consumes fewer hardware resources and offers higher generation quality for various workloads with different kinds of Service Level Objectives (SLOs), when comparing with the existing alternative solutions (e.g., KV cache disaggregation, retrieval-based sparse attention). The crux of AlayaDB is that it abstracts the attention computation and cache management for LLM inference into a query processing procedure, and optimizes the performance via a native query optimizer. In this work, we demonstrate the effectiveness of AlayaDB via (i) three use cases from our industry partners, and (ii) extensive experimental results on LLM inference benchmarks.

arxiv情報

著者 Yangshen Deng,Zhengxin You,Long Xiang,Qilong Li,Peiqi Yuan,Zhaoyang Hong,Yitao Zheng,Wanting Li,Runzhong Li,Haotian Liu,Kyriakos Mouratidis,Man Lung Yiu,Huan Li,Qiaomu Shen,Rui Mao,Bo Tang
発行日 2025-04-14 15:34:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.IR, H.3.3 | AlayaDB: The Data Foundation for Efficient and Effective Long-context LLM Inference はコメントを受け付けていません

Heimdall: test-time scaling on the generative verification

要約

AIシステムは、知識自体を確認できる範囲でのみ、知識を作成および維持できます。
長い考え方の推論に関する最近の研究は、競争上の問題を解決するためのLLMの大きな可能性を実証していますが、その検証能力は弱く、十分に調査されていないことを示しています。
この論文では、ソリューションの正確性を正確に判断できる長いCOT検証LLMであるHeimdallを提案します。
純粋な強化学習により、競争力のある数学の問題で検証精度を62.5%から94.5%に増やします。
サンプリングを繰り返してスケーリングすることにより、精度はさらに97.5%に増加します。
Heimdallは、人間の評価を通じて、印象的な一般化能力を実証し、挑戦的な数学の証明のほとんどの問題をうまく検出します。トレーニング中には含まれていません。
さらに、Heimdallの機能を拡張して問題解決を拡大するために、悲観的な検証を提案します。
ソルバーモデルからソリューションを判断し、悲観的な原理に基づいて、Heimdallを呼び出して、不確実性が最も少ない最も可能性の高いソリューションを選択します。
DeepSeek-R1-Distill-Qwen-32Bをソルバーモデルとして採用すると、悲観的な検証により、AIME2025のソリューションの精度が54.2%から70.0%に16倍の計算予算で、より多くの計算予算で83.3%になります。
Solver Gemini 2.5 Proが強いと、スコアは93.0%に達します。
最後に、自動知識発見システムをプロトタイプ化します。これは、質問を提起する三元システムであり、別の人がソリューションを提供し、3番目のシステムがソリューションを検証します。
最初の2つのコンポーネントにデータ合成作業nuniNamathを使用すると、Heimdallはデータセット内の問題のあるレコードを効果的に識別し、データのほぼ半分が欠陥があることを明らかにします。

要約(オリジナル)

An AI system can create and maintain knowledge only to the extent that it can verify that knowledge itself. Recent work on long Chain-of-Thought reasoning has demonstrated great potential of LLMs on solving competitive problems, but their verification ability remains to be weak and not sufficiently investigated. In this paper, we propose Heimdall, the long CoT verification LLM that can accurately judge the correctness of solutions. With pure reinforcement learning, we boost the verification accuracy from 62.5% to 94.5% on competitive math problems. By scaling with repeated sampling, the accuracy further increases to 97.5%. Through human evaluation, Heimdall demonstrates impressive generalization capabilities, successfully detecting most issues in challenging math proofs, the type of which is not included during training. Furthermore, we propose Pessimistic Verification to extend the functionality of Heimdall to scaling up the problem solving. It calls Heimdall to judge the solutions from a solver model and based on the pessimistic principle, selects the most likely correct solution with the least uncertainty. Taking DeepSeek-R1-Distill-Qwen-32B as the solver model, Pessimistic Verification improves the solution accuracy on AIME2025 from 54.2% to 70.0% with 16x compute budget and to 83.3% with more compute budget. With the stronger solver Gemini 2.5 Pro, the score reaches 93.0%. Finally, we prototype an automatic knowledge discovery system, a ternary system where one poses questions, another provides solutions, and the third verifies the solutions. Using the data synthesis work NuminaMath for the first two components, Heimdall effectively identifies problematic records within the dataset and reveals that nearly half of the data is flawed, which interestingly aligns with the recent ablation studies from NuminaMath.

arxiv情報

著者 Wenlei Shi,Xing Jin
発行日 2025-04-14 15:46:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, I.2.7 | Heimdall: test-time scaling on the generative verification はコメントを受け付けていません

Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families

要約

臨床症例報告は、構造化されたデータに依存する従来の機械学習方法によってしばしば露出度が低い豊富な時間的患者の軌跡をコードします。
この作業では、テキストの時系列から予測問題を紹介します。ここでは、LLM支援の注釈パイプラインを介して抽出された臨床所見を予測の主要な入力として描写しました。
イベントの発生予測、時間的順序付け、生存分析のタスクで、微調整されたデコーダーベースの大手言語モデルとエンコーダーベースのトランスを含む多様なモデルスイートを体系的に評価します。
私たちの実験では、エンコーダーベースのモデルが一貫してより高いF1スコアと短距離および長距離イベントの予測に優れた時間的一致を達成し、微調整されたマスキングアプローチはランキングパフォーマンスを向上させることが明らかになりました。
対照的に、命令チューニングされたデコーダーモデルは、特に早期予後の設定で、生存分析において相対的な利点を示しています。
私たちの感度分析は、LLMが古典的に訓練されているテキスト入力の形式であるテキスト順序と比較して、臨床時系列構造を必要とする時間順序の重要性をさらに実証します。
これは、時間式のコーパスから確認できる追加の利点を強調し、広範囲にわたるLLM使用の時代の時間的タスクに影響を与えます。

要約(オリジナル)

Clinical case reports encode rich, temporal patient trajectories that are often underexploited by traditional machine learning methods relying on structured data. In this work, we introduce the forecasting problem from textual time series, where timestamped clinical findings–extracted via an LLM-assisted annotation pipeline–serve as the primary input for prediction. We systematically evaluate a diverse suite of models, including fine-tuned decoder-based large language models and encoder-based transformers, on tasks of event occurrence prediction, temporal ordering, and survival analysis. Our experiments reveal that encoder-based models consistently achieve higher F1 scores and superior temporal concordance for short- and long-horizon event forecasting, while fine-tuned masking approaches enhance ranking performance. In contrast, instruction-tuned decoder models demonstrate a relative advantage in survival analysis, especially in early prognosis settings. Our sensitivity analyses further demonstrate the importance of time ordering, which requires clinical time series construction, as compared to text ordering, the format of the text inputs that LLMs are classically trained on. This highlights the additional benefit that can be ascertained from time-ordered corpora, with implications for temporal tasks in the era of widespread LLM use.

arxiv情報

著者 Shahriar Noroozizadeh,Sayantan Kumar,Jeremy C. Weiss
発行日 2025-04-14 15:48:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families はコメントを受け付けていません

Artificial Neural Network for Estimation of Physical Parameters of Sea Water using LiDAR Waveforms

要約

光検出と範囲(LIDAR)は、地球観測の分野で急速に新たなセンサーです。
これは、レーザービームを利用して距離を測定し、オブジェクトと環境の詳細な3次元表現を作成するリモートセンシングテクノロジーです。
完全な波形Lidarの可能性は、高さの推定と3D再構成のみよりもはるかに大きいです。
信号の全体的な形状は、水域の特性に関する重要な情報を提供します。
ただし、波形内の最大値を利用することにより、ほとんどのLIDARソフトウェアがPoint Cloudで機能するため、FWLの形状は未開拓です。
LIDARデータ分析の分野における既存の手法には、減衰係数を近似するための対数強度と深さの逆モデリングと回帰による深度推定が含まれます。
ただし、これらの方法は正確さの制限に悩まされています。
逆モデリングによる深度推定は、近似値のみを提供し、表面特性の変動を説明しませんが、減衰係数の回帰アプローチは、精度がなく、推定に有意なエラーにつながる可能性のあるいくつかのデータポイントを介して値を一般化することができます。
さらに、現在、底部反射率を予測するための確立されたモデリング方法はありません。
この研究では、LIDARデータ分析におけるパラメーター推定のためのニューラルネットワークに基づく新しいソリューションを提案しました。
ニューラルネットワークの能力を活用することにより、提案されたソリューションは反転モデルを成功裏に学習し、深さ、減衰係数、底反射などのパラメーターの予測を行うことができました。
モデルのパフォーマンスは、実際のLIDARデータでテストすることにより検証されました。
将来的には、データの可用性が増えると、このようなモデルの精度と信頼性が向上します。

要約(オリジナル)

Light Detection and Ranging (LiDAR) are fast emerging sensors in the field of Earth Observation. It is a remote sensing technology that utilizes laser beams to measure distances and create detailed three-dimensional representations of objects and environments. The potential of Full Waveform LiDAR is much greater than just height estimation and 3D reconstruction only. Overall shape of signal provides important information about properties of water body. However, the shape of FWL is unexplored as most LiDAR software work on point cloud by utilizing the maximum value within the waveform. Existing techniques in the field of LiDAR data analysis include depth estimation through inverse modeling and regression of logarithmic intensity and depth for approximating the attenuation coefficient. However, these methods suffer from limitations in accuracy. Depth estimation through inverse modeling provides only approximate values and does not account for variations in surface properties, while the regression approach for the attenuation coefficient is only able to generalize a value through several data points which lacks precision and may lead to significant errors in estimation. Additionally, there is currently no established modeling method available for predicting bottom reflectance. This research proposed a novel solution based on neural networks for parameter estimation in LIDAR data analysis. By leveraging the power of neural networks, the proposed solution successfully learned the inversion model, was able to do prediction of parameters such as depth, attenuation coefficient, and bottom reflectance. Performance of model was validated by testing it on real LiDAR data. In future, more data availability would enable more accuracy and reliability of such models.

arxiv情報

著者 Saad Ahmed Jamal
発行日 2025-04-14 15:58:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.SP | Artificial Neural Network for Estimation of Physical Parameters of Sea Water using LiDAR Waveforms はコメントを受け付けていません

Embedding Ontologies via Incorporating Extensional and Intensional Knowledge

要約

オントロジーには、ドメイン内の豊富な知識が含まれており、2つのカテゴリ、すなわち拡張知識とインテンションの知識に分類できます。
拡張知識は、オントロジーの特定の概念に属する具体的なインスタンスに関する情報を提供し、概念間の固有の特性、特性、およびセマンティックな関連付けを詳細に説明します。
ただし、既存のオントロジーの埋め込みアプローチは、拡張的な知識とインテンションの知識の両方を同時に微妙な考慮事項に取り入れることができません。
この論文では、EIKE(拡張およびインテンションの知識埋め込み)という名前の新しいオントロジー埋め込みアプローチを提案します。これは、拡張空間とインテンション空間と呼ばれる2つのスペースでオントロジーを表現します。
EIKEは、オントロジーにインスタンス、概念、およびそれらの関係を埋め込むための統一されたフレームワークを提示し、拡張知識をモデル化するためのジオメトリベースの方法と、構造情報とテキスト情報の両方をキャプチャできる意図的な知識をモデル化するためにモデル化された言語モデルをモデル化します。
実験結果は、EIKEがトリプル分類とリンク予測の両方で3つのデータセットで最先端の方法を大幅に上回ることを示しており、EIKEがドメインのより包括的で代表的な視点を提供することを示しています。

要約(オリジナル)

Ontologies contain rich knowledge within domain, which can be divided into two categories, namely extensional knowledge and intensional knowledge. Extensional knowledge provides information about the concrete instances that belong to specific concepts in the ontology, while intensional knowledge details inherent properties, characteristics, and semantic associations among concepts. However, existing ontology embedding approaches fail to take both extensional knowledge and intensional knowledge into fine consideration simultaneously. In this paper, we propose a novel ontology embedding approach named EIKE (Extensional and Intensional Knowledge Embedding) by representing ontologies in two spaces, called extensional space and intensional space. EIKE presents a unified framework for embedding instances, concepts and their relations in an ontology, applying a geometry-based method to model extensional knowledge and a pretrained language model to model intensional knowledge, which can capture both structure information and textual information. Experimental results show that EIKE significantly outperforms state-of-the-art methods in three datasets for both triple classification and link prediction, indicating that EIKE provides a more comprehensive and representative perspective of the domain.

arxiv情報

著者 Keyu Wang,Guilin Qi,Jiaoyan Chen,Yi Huang,Tianxing Wu
発行日 2025-04-14 16:08:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Embedding Ontologies via Incorporating Extensional and Intensional Knowledge はコメントを受け付けていません