月別アーカイブ: 2025年2月

Enhanced Feature-based Image Stitching for Endoscopic Videos in Pediatric Eosinophilic Esophagitis

要約 ビデオ内視鏡​​検査は、胃腸疾患の調査における大きな進歩を表しています。 … 続きを読む

カテゴリー: cs.CV | Enhanced Feature-based Image Stitching for Endoscopic Videos in Pediatric Eosinophilic Esophagitis はコメントを受け付けていません

Éclair — Extracting Content and Layout with Integrated Reading Order for Documents

要約 光学文字認識(OCR)テクノロジーは、ドキュメントの画像からテキストを抽出 … 続きを読む

カテゴリー: cs.CV | Éclair — Extracting Content and Layout with Integrated Reading Order for Documents はコメントを受け付けていません

Keep It Light! Simplifying Image Clustering Via Text-Free Adapters

要約 多くの競争力のあるクラスタリングパイプラインには、マルチモーダル設計があり … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, stat.CO, stat.ML | Keep It Light! Simplifying Image Clustering Via Text-Free Adapters はコメントを受け付けていません

VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation

要約 高速ビデオ(HSV)セグメンテーションは、熱伝達などの科学的および産業用途 … 続きを読む

カテゴリー: cs.CV, cs.LG | VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation はコメントを受け付けていません

An object detection approach for lane change and overtake detection from motion profiles

要約 艦隊管理とドライバーの監視のアプリケーションドメインでは、保存および分析さ … 続きを読む

カテゴリー: cs.CV | An object detection approach for lane change and overtake detection from motion profiles はコメントを受け付けていません

Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion

要約 クリップのような事前に訓練されたマルチモーダルビジョン言語モデルは、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion はコメントを受け付けていません

PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching

要約 マッピングは、モバイルロボットの自律的なナビゲーションを可能にする重要なタ … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching はコメントを受け付けていません

Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances

要約 指向性オブジェクト検出(OOD)に対する需要が急速に増加しているため、ポイ … 続きを読む

カテゴリー: cs.AI, cs.CV | Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances はコメントを受け付けていません

Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model

要約 Interactive 3Dシミュレーションオブジェクトは、AR/VR、ア … 続きを読む

カテゴリー: cs.CV | Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model はコメントを受け付けていません

GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation

要約 モデルフリーのカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴ … 続きを読む

カテゴリー: cs.CV | GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation はコメントを受け付けていません