-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Enhanced Feature-based Image Stitching for Endoscopic Videos in Pediatric Eosinophilic Esophagitis
要約 ビデオ内視鏡検査は、胃腸疾患の調査における大きな進歩を表しています。 … 続きを読む
カテゴリー: cs.CV
Enhanced Feature-based Image Stitching for Endoscopic Videos in Pediatric Eosinophilic Esophagitis はコメントを受け付けていません
Éclair — Extracting Content and Layout with Integrated Reading Order for Documents
要約 光学文字認識(OCR)テクノロジーは、ドキュメントの画像からテキストを抽出 … 続きを読む
カテゴリー: cs.CV
Éclair — Extracting Content and Layout with Integrated Reading Order for Documents はコメントを受け付けていません
Keep It Light! Simplifying Image Clustering Via Text-Free Adapters
要約 多くの競争力のあるクラスタリングパイプラインには、マルチモーダル設計があり … 続きを読む
VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation
要約 高速ビデオ(HSV)セグメンテーションは、熱伝達などの科学的および産業用途 … 続きを読む
An object detection approach for lane change and overtake detection from motion profiles
要約 艦隊管理とドライバーの監視のアプリケーションドメインでは、保存および分析さ … 続きを読む
カテゴリー: cs.CV
An object detection approach for lane change and overtake detection from motion profiles はコメントを受け付けていません
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion
要約 クリップのような事前に訓練されたマルチモーダルビジョン言語モデルは、さまざ … 続きを読む
PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching
要約 マッピングは、モバイルロボットの自律的なナビゲーションを可能にする重要なタ … 続きを読む
Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances
要約 指向性オブジェクト検出(OOD)に対する需要が急速に増加しているため、ポイ … 続きを読む
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model
要約 Interactive 3Dシミュレーションオブジェクトは、AR/VR、ア … 続きを読む
カテゴリー: cs.CV
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model はコメントを受け付けていません
GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation
要約 モデルフリーのカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴ … 続きを読む
カテゴリー: cs.CV
GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation はコメントを受け付けていません