Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review

要約

推論能力は通常、数千億のパラメーターを備えた大規模な言語モデル(LLMS)に現れますが、最近の研究では、商用LMSからの知識蒸留(KD)を通じて小規模なオープンソースモデルの改善に焦点を当てています。
ただし、これらの研究の多くは、正解と間違いの背後にある理由の両方を理解することを含む、自然な人間の学習プロセスとは異なり、単一のLLMからの反応のみに金の根拠として依存しています。
この論文では、ピアレビュー(公正)アプローチを介して新しい断層を意識した蒸留を紹介します:1)教師から理論的根拠を取得する代わりに、私たちの方法は、教師に学生の間違いを特定して説明し、カスタマイズされた指導学習データを提供するよう求めます。
2)教師LLMS間でシミュレートされたピアレビュープロセスを設計します。これは、受け入れのしきい値を超える生成された理論的根拠のみを選択します。
これにより、教師が欠陥のある理論的根拠で正しく推測する可能性が低くなり、教育データの品質が向上します。
数学的、常識的、論理的な推論タスクに関する包括的な実験と分析は、私たちの方法の有効性を示しています。

要約(オリジナル)

While reasoning capabilities typically emerge in large language models (LLMs) with tens of billions of parameters, recent research focuses on improving smaller open-source models through knowledge distillation (KD) from commercial LLMs. However, many of these studies rely solely on responses from a single LLM as the gold rationale, unlike the natural human learning process, which involves understanding both the correct answers and the reasons behind mistakes. In this paper, we introduce a novel Fault-Aware DistIllation via Peer-Review (FAIR) approach: 1) Instead of merely obtaining rationales from teachers, our method asks teachers to identify and explain the student’s mistakes, providing customized instruction learning data. 2) We design a simulated peer-review process between teacher LLMs, which selects only the generated rationales above the acceptance threshold. This reduces the chance of teachers guessing correctly with flawed rationale, improving instructional data quality. Comprehensive experiments and analysis on mathematical, commonsense, and logical reasoning tasks demonstrate the effectiveness of our method.

arxiv情報

著者 Zhuochun Li,Yuelyu Ji,Rui Meng,Daqing He
発行日 2025-02-19 18:34:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review はコメントを受け付けていません

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

要約

トレーニングプロセス報酬モデル(PRMS)の現在のアプローチでは、事前定義されたプレースホルダートークンを使用したり、推論ステップの長さを固定サイズに設定するなど、ルールベースの手法を使用して、応答を複数の推論ステップに分割します。
これらのアプローチは、特定の単語が通常、テキストの真の決定ポイントをマークしないという事実を見落としています。
これに対処するために、Adaptivestepを提案します。これは、次の単語を予測するというモデルの自信に基づいて推論ステップを分割する方法です。
この分割方法は、各ステップでより多くの意思決定情報を提供し、報酬モデル学習などの下流タスクを強化します。
さらに、私たちの方法では手動注釈は必要ありません。
数学的推論とコード生成タスクにおけるAdaptivestepトレーニングを受けたPRMを使用した実験を通じて、その有効性を実証します。
実験結果は、結果のPRMが最先端のベストNパフォーマンスを達成し、トークンレベルの価値誘導デコードで貪欲な検索戦略を上回り、既存のオープンソースと比較して建設コストを30%以上削減することを示しています。
PRMS。
さらに、PRMのパフォーマンス、転送可能性、および一般化機能に関する徹底的な分析とケーススタディを提供します。

要約(オリジナル)

Current approaches for training Process Reward Models (PRMs) often involve breaking down responses into multiple reasoning steps using rule-based techniques, such as using predefined placeholder tokens or setting the reasoning step’s length into a fixed size. These approaches overlook the fact that specific words do not typically mark true decision points in a text. To address this, we propose AdaptiveStep, a method that divides reasoning steps based on the model’s confidence in predicting the next word. This division method provides more decision-making information at each step, enhancing downstream tasks, such as reward model learning. Moreover, our method does not require manual annotation. We demonstrate its effectiveness through experiments with AdaptiveStep-trained PRMs in mathematical reasoning and code generation tasks. Experimental results indicate that the outcome PRM achieves state-of-the-art Best-of-N performance, surpassing greedy search strategy with token-level value-guided decoding, while also reducing construction costs by over 30% compared to existing open-source PRMs. In addition, we provide a thorough analysis and case study on the PRM’s performance, transferability, and generalization capabilities.

arxiv情報

著者 Yuliang Liu,Junjie Lu,Zhaoling Chen,Chaofeng Qu,Jason Klein Liu,Chonghan Liu,Zefan Cai,Yunhui Xia,Li Zhao,Jiang Bian,Chuheng Zhang,Wei Shen,Zhouhan Lin
発行日 2025-02-19 18:35:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG | AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence はコメントを受け付けていません

Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region

要約

大規模な言語モデル(LLMS)の安全性の配置は脆弱なままです。なぜなら、その初期の動作は比較的単純な攻撃によっても簡単に投獄される可能性があるためです。
入力命令と初期モデル出力の間に固定テンプレートを埋めることは、既存のLLMの一般的な慣行であるため、このテンプレートは脆弱性の背後にある重要な要素であると仮定します。LLMSの安全関連の意思決定は、集計情報からの集計情報に依存しています。
これらのモデルの安全行動に大きく影響するテンプレート領域。
この問題は、テンプレートアンカーの安全アライメントと呼びます。
このホワイトペーパーでは、広範な実験を実施し、テンプレートアンカーの安全アライメントがさまざまな整列LLMに広がっていることを確認します。
私たちの機械的分析は、推論時の脱獄攻撃に遭遇したときのモデルの感受性にそれがどのようにつながるかを示しています。
さらに、テンプレート領域からの安全性メカニズムの分離が、脱獄攻撃に対する脆弱性を緩和することに有望であることを示しています。
将来の研究では、テンプレート領域への依存を減らす、より堅牢な安全アライメント技術を開発することを奨励しています。

要約(オリジナル)

The safety alignment of large language models (LLMs) remains vulnerable, as their initial behavior can be easily jailbroken by even relatively simple attacks. Since infilling a fixed template between the input instruction and initial model output is a common practice for existing LLMs, we hypothesize that this template is a key factor behind their vulnerabilities: LLMs’ safety-related decision-making overly relies on the aggregated information from the template region, which largely influences these models’ safety behavior. We refer to this issue as template-anchored safety alignment. In this paper, we conduct extensive experiments and verify that template-anchored safety alignment is widespread across various aligned LLMs. Our mechanistic analyses demonstrate how it leads to models’ susceptibility when encountering inference-time jailbreak attacks. Furthermore, we show that detaching safety mechanisms from the template region is promising in mitigating vulnerabilities to jailbreak attacks. We encourage future research to develop more robust safety alignment techniques that reduce reliance on the template region.

arxiv情報

著者 Chak Tou Leong,Qingyu Yin,Jian Wang,Wenjie Li
発行日 2025-02-19 18:42:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CR | Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region はコメントを受け付けていません

Neurosymbolic artificial intelligence via large language models and coherence-driven inference

要約

アルゴリズムを考案して、コヒーレンス駆動型の推論をサポートするグラフを客観的にインスタンス化する命題セットを生成します。
次に、大規模な言語モデル(LLM)の能力をベンチマークし、自然言語で表現された命題の(単純な変換)命題からコヒーレンスグラフを再構築し、単一のプロンプトから推論に最適化されたモデルまでの有望な結果をベンチマークします。
コヒーレンス駆動型の推論を、ニューラルモデルによる一貫性評価と組み合わせることで、機械認知の最新技術を進めることができます。

要約(オリジナル)

We devise an algorithm to generate sets of propositions that objectively instantiate graphs that support coherence-driven inference. We then benchmark the ability of large language models (LLMs) to reconstruct coherence graphs from (a straightforward transformation of) propositions expressed in natural language, with promising results from a single prompt to models optimized for reasoning. Combining coherence-driven inference with consistency evaluations by neural models may advance the state of the art in machine cognition.

arxiv情報

著者 Steve Huntsman,Jewell Thomas
発行日 2025-02-19 18:53:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Neurosymbolic artificial intelligence via large language models and coherence-driven inference はコメントを受け付けていません

RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision

要約

検索された生成(RAG)は、知識集約型のタスクの大きな可能性を示していますが、その従来のアーキテクチャは静的検索に依存しており、連続した情報を求める必要がある複雑な質問に対する有効性を制限しています。
エージェントの推論と検索はより適応的なアプローチを提供しますが、ほとんどの既存の方法は迅速なエンジニアリングに大きく依存しています。
この作業では、各検索ステップで微調整されたプロセス監督を通じて情報を求めるエージェントを強化する統一された最適化フレームワークであるRag-Gymを紹介します。
また、Rag-Gymフレームワーク内の回答推論と検索クエリの生成を相乗化する新しいエージェントアーキテクチャである研究を提案します。
4つの挑戦的なデータセットでの実験は、Rag-Gymがさまざまなエージェントアーキテクチャで最大25.6 \%のパフォーマンスを改善し、既存のベースラインを一貫して優先する研究を示しています。
さらなる分析では、プロセス報酬裁判官としての高度なLLMの有効性と、異なるLLMの検証因子としての訓練された報酬モデルの移転性を強調しています。
さらに、エージェントラグのトレーニングと推論のスケーリング特性を調べます。
プロジェクトホームページは、https://rag-gym.github.io/で入手できます。

要約(オリジナル)

Retrieval-augmented generation (RAG) has shown great potential for knowledge-intensive tasks, but its traditional architectures rely on static retrieval, limiting their effectiveness for complex questions that require sequential information-seeking. While agentic reasoning and search offer a more adaptive approach, most existing methods depend heavily on prompt engineering. In this work, we introduce RAG-Gym, a unified optimization framework that enhances information-seeking agents through fine-grained process supervision at each search step. We also propose ReSearch, a novel agent architecture that synergizes answer reasoning and search query generation within the RAG-Gym framework. Experiments on four challenging datasets show that RAG-Gym improves performance by up to 25.6\% across various agent architectures, with ReSearch consistently outperforming existing baselines. Further analysis highlights the effectiveness of advanced LLMs as process reward judges and the transferability of trained reward models as verifiers for different LLMs. Additionally, we examine the scaling properties of training and inference in agentic RAG. The project homepage is available at https://rag-gym.github.io/.

arxiv情報

著者 Guangzhi Xiong,Qiao Jin,Xiao Wang,Yin Fang,Haolin Liu,Yifan Yang,Fangyuan Chen,Zhixing Song,Dengyu Wang,Minjia Zhang,Zhiyong Lu,Aidong Zhang
発行日 2025-02-19 18:56:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision はコメントを受け付けていません

Autellix: An Efficient Serving Engine for LLM Agents as General Programs

要約

大規模な言語モデル(LLM)アプリケーションは、単純なチャットボットを超えて動的な汎用エージェントプログラムに進化しています。これは、LLMコールと出力トークンをスケーリングして、AIエージェントが複雑なタスクの推論、探索、解決を支援します。
ただし、既存のLLMサービングシステムは、プログラムとコールの間の依存関係を無視し、最適化のための重要な機会を欠いています。
私たちの分析により、LLMサービスエンジンに提出されたプログラムは、主に個々のLLMリクエストとプログラムの両方で頭のブロックをブロックしたため、長い累積待機時間を経験していることが明らかになりました。
これに対処するために、エンドツーエンドのレイテンシーを最小限に抑えるためにプログラムを一流の市民として扱うLLMサービングシステムであるAutellixを紹介します。
Autellixは、プログラムレベルのコンテキストでスケジューラを充実させるLLMコールをプログラムで送信します。
以前に完了したコールに基づいて、LLMコールを優先して優先順位を付ける、シングルスレッドおよび分散プログラムのために2つのスケジューリングアルゴリズムを提案します。
私たちの評価は、多様なLLMとエージェントワークロード全体で、AutellixがVLLMなどの最先端のシステムと比較して、同じ遅延でプログラムのスループットを4〜15倍改善することを示しています。

要約(オリジナル)

Large language model (LLM) applications are evolving beyond simple chatbots into dynamic, general-purpose agentic programs, which scale LLM calls and output tokens to help AI agents reason, explore, and solve complex tasks. However, existing LLM serving systems ignore dependencies between programs and calls, missing significant opportunities for optimization. Our analysis reveals that programs submitted to LLM serving engines experience long cumulative wait times, primarily due to head-of-line blocking at both the individual LLM request and the program. To address this, we introduce Autellix, an LLM serving system that treats programs as first-class citizens to minimize their end-to-end latencies. Autellix intercepts LLM calls submitted by programs, enriching schedulers with program-level context. We propose two scheduling algorithms-for single-threaded and distributed programs-that preempt and prioritize LLM calls based on their programs’ previously completed calls. Our evaluation demonstrates that across diverse LLMs and agentic workloads, Autellix improves throughput of programs by 4-15x at the same latency compared to state-of-the-art systems, such as vLLM.

arxiv情報

著者 Michael Luo,Xiaoxiang Shi,Colin Cai,Tianjun Zhang,Justin Wong,Yichuan Wang,Chi Wang,Yanping Huang,Zhifeng Chen,Joseph E. Gonzalez,Ion Stoica
発行日 2025-02-19 18:59:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC, cs.LG | Autellix: An Efficient Serving Engine for LLM Agents as General Programs はコメントを受け付けていません

Exploring Mutual Cross-Modal Attention for Context-Aware Human Affordance Generation

要約

人間のアフォーダンス学習は、推定されたポーズがシーン内の有効な人間の行動を表すように、文脈的に関連する斬新なポーズ予測を調査します。
タスクは機械の知覚と自動化されたインタラクティブナビゲーションエージェントの基本ですが、指数関数的に多数の可能性のあるポーズとアクションのバリエーションにより、問題が挑戦的で自明でないことがあります。
ただし、2Dシーンでの人間のアフォーダンス予測のための既存のデータセットと方法は、文献では大幅に制限されています。
このホワイトペーパーでは、2つの異なるモダリティからの空間機能マップに相互に参加することにより、アフォーダンス予測のシーンコンテキストをエンコードするための新しい分析メカニズムを提案します。
提案された方法は、問題の複雑さを効率的に減らすために、個々のサブタスクの間で解き放たれます。
まず、グローバルシーンコンテキストエンコーディングに条件付けられた変分自動エンコーダー(VAE)を使用して、シーン内の人の可能性のある場所をサンプリングします。
次に、予測場所をエンコードするローカルコンテキストの分類器を使用して、既存の人間のポーズ候補のセットから潜在的なポーズテンプレートを予測します。
後続の手順では、2つのVAEを使用して、ローカルコンテキストとテンプレートクラスを条件付けすることにより、予測ポーズテンプレートのスケールと変形パラメーターをサンプリングします。
私たちの実験は、複雑な2Dシーンへの人間のアフォーダンス注入の以前のベースラインにわたって大幅な改善を示しています。

要約(オリジナル)

Human affordance learning investigates contextually relevant novel pose prediction such that the estimated pose represents a valid human action within the scene. While the task is fundamental to machine perception and automated interactive navigation agents, the exponentially large number of probable pose and action variations make the problem challenging and non-trivial. However, the existing datasets and methods for human affordance prediction in 2D scenes are significantly limited in the literature. In this paper, we propose a novel cross-attention mechanism to encode the scene context for affordance prediction by mutually attending spatial feature maps from two different modalities. The proposed method is disentangled among individual subtasks to efficiently reduce the problem complexity. First, we sample a probable location for a person within the scene using a variational autoencoder (VAE) conditioned on the global scene context encoding. Next, we predict a potential pose template from a set of existing human pose candidates using a classifier on the local context encoding around the predicted location. In the subsequent steps, we use two VAEs to sample the scale and deformation parameters for the predicted pose template by conditioning on the local context and template class. Our experiments show significant improvements over the previous baseline of human affordance injection into complex 2D scenes.

arxiv情報

著者 Prasun Roy,Saumik Bhattacharya,Subhankar Ghosh,Umapada Pal,Michael Blumenstein
発行日 2025-02-19 11:24:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM | Exploring Mutual Cross-Modal Attention for Context-Aware Human Affordance Generation はコメントを受け付けていません

V2C-Long: Longitudinal Cortex Reconstruction with Spatiotemporal Correspondence

要約

縦方向の磁気共鳴画像法(MRI)から皮質を再構築することは、人間の脳の形態学的変化を分析するために不可欠です。
深い学習を伴う皮質表面再建の最近の進歩にもかかわらず、縦断的データから生じる課題は依然として永続的です。
特に、高度に複雑な脳表面間の強い空間的ポイントの対応の欠如は、解剖学的位置が正確に一致しない場合、局所的な形態が直接匹敵しないため、下流の分析を妨げます。
この問題に対処するために、縦MRIの最初の専用の深い学習ベースの皮質再建法であるV2C-Longを提示します。
V2Cロングは、被験者と訪問にわたって強い固有の空間的対応を示し、それにより表面ベースの後処理の必要性を減らします。
再構成中に、2つの深いテンプレートと変形ネットワークの構成とメッシュ空間内の被験者内テンプレートの革新的な集約を介して、この対応を直接確立します。
2つの大規模なニューロイメージング研究でV2Cロングを検証し、表面の精度、一貫性、一般化、テスト再テストの信頼性、および感度に焦点を当てています。
結果は、既存の方法と比較して、縦断的な一貫性と精度の大幅な改善を明らかにしています。
さらに、アルツハイマー病における縦方向の皮質萎縮の強力な証拠を縦方向のフリーザーファーよりも示します。

要約(オリジナル)

Reconstructing the cortex from longitudinal magnetic resonance imaging (MRI) is indispensable for analyzing morphological alterations in the human brain. Despite the recent advancement of cortical surface reconstruction with deep learning, challenges arising from longitudinal data are still persistent. Especially the lack of strong spatiotemporal point correspondence between highly convoluted brain surfaces hinders downstream analyses, as local morphology is not directly comparable if the anatomical location is not matched precisely. To address this issue, we present V2C-Long, the first dedicated deep learning-based cortex reconstruction method for longitudinal MRI. V2C-Long exhibits strong inherent spatiotemporal correspondence across subjects and visits, thereby reducing the need for surface-based post-processing. We establish this correspondence directly during the reconstruction via the composition of two deep template-deformation networks and innovative aggregation of within-subject templates in mesh space. We validate V2C-Long on two large neuroimaging studies, focusing on surface accuracy, consistency, generalization, test-retest reliability, and sensitivity. The results reveal a substantial improvement in longitudinal consistency and accuracy compared to existing methods. In addition, we demonstrate stronger evidence for longitudinal cortical atrophy in Alzheimer’s disease than longitudinal FreeSurfer.

arxiv情報

著者 Fabian Bongratz,Jan Fecht,Anne-Marie Rickmann,Christian Wachinger
発行日 2025-02-19 12:16:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV | V2C-Long: Longitudinal Cortex Reconstruction with Spatiotemporal Correspondence はコメントを受け付けていません

pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM

要約

Pyslamは、視覚的なスラムのオープンソースPythonフレームワークであり、単眼、ステレオ、RGB-Dカメラをサポートしています。
クラシックと最新のローカル機能の両方を統合するための柔軟なインターフェイスを提供し、さまざまなスラムタスクに適応できます。
フレームワークには、異なるループ閉鎖方法、体積再構成パイプライン、および深度予測モデルのサポートが含まれます。
さらに、視覚的な臭気とスラムアプリケーションのための一連のツールを提供します。
初心者と経験豊富な研究者の両方のために設計されたPyslamは、コミュニティの貢献を奨励し、ビジュアルスラムの分野での共同開発を促進します。

要約(オリジナル)

pySLAM is an open-source Python framework for Visual SLAM, supporting monocular, stereo, and RGB-D cameras. It provides a flexible interface for integrating both classical and modern local features, making it adaptable to various SLAM tasks. The framework includes different loop closure methods, a volumetric reconstruction pipeline, and support for depth prediction models. Additionally, it offers a suite of tools for visual odometry and SLAM applications. Designed for both beginners and experienced researchers, pySLAM encourages community contributions, fostering collaborative development in the field of Visual SLAM.

arxiv情報

著者 Luigi Freda
発行日 2025-02-19 12:27:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM はコメントを受け付けていません

Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition

要約

ロボット工学の最近の進歩により、長期的および大規模なミッションの実世界の自律性が促進されています。このミッションでは、場所認識によるループ閉鎖は、ポーズ推定ドリフトを緩和するために不可欠です。
ただし、リアルタイムのパフォーマンスを達成することは、高密度サンプリングの計算負担により、リソース制約のあるモバイルロボットとマルチロボットシステムにとって困難なままであり、成長するMAPデータベースとクエリサンプルを比較および検証する複雑さを高めます。
従来の方法は、特定のサンプリング間隔に依存したり、記述子機能空間ではなく3Dスペースで動作することにより、冗長な情報を保持したり、重要なデータを見逃したりすることがよくあります。
これらの課題に対処するために、サンプルスペースの概念を紹介し、LIDARベースの場所認識のための新しいキーフレームサンプリングアプローチを提案します。
私たちの方法は、高次元の記述子空間に重要な情報を保存しながら、学習ベースと手作りの記述子の両方をサポートしながら、冗長性を最小限に抑えます。
提案されたアプローチには、スライド式ウィンドウの最適化戦略が組み込まれており、効率的なキーフレームの選択とリアルタイムのパフォーマンスを確保し、ロボットパイプラインへのシームレスな統合を可能にします。
要するに、私たちのアプローチは、パラメーターチューニングなしで屋内から屋外シナリオから屋外へのシナリオから屋外へのシナリオからシームレスに適応する機能を備えた、多様なデータセット全体で堅牢なパフォーマンスを示し、ループ閉鎖検出時間とメモリ要件を削減します。

要約(オリジナル)

Recent advances in robotics are driving real-world autonomy for long-term and large-scale missions, where loop closures via place recognition are vital for mitigating pose estimation drift. However, achieving real-time performance remains challenging for resource-constrained mobile robots and multi-robot systems due to the computational burden of high-density sampling, which increases the complexity of comparing and verifying query samples against a growing map database. Conventional methods often retain redundant information or miss critical data by relying on fixed sampling intervals or operating in 3-D space instead of the descriptor feature space. To address these challenges, we introduce the concept of sample space and propose a novel keyframe sampling approach for LiDAR-based place recognition. Our method minimizes redundancy while preserving essential information in the hyper-dimensional descriptor space, supporting both learning-based and handcrafted descriptors. The proposed approach incorporates a sliding window optimization strategy to ensure efficient keyframe selection and real-time performance, enabling seamless integration into robotic pipelines. In sum, our approach demonstrates robust performance across diverse datasets, with the ability to adapt seamlessly from indoor to outdoor scenarios without parameter tuning, reducing loop closure detection times and memory requirements.

arxiv情報

著者 Nikolaos Stathoulopoulos,Vidya Sumathy,Christoforos Kanellakis,George Nikolakopoulos
発行日 2025-02-19 12:54:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition はコメントを受け付けていません