cs.CV」カテゴリーアーカイブ

Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations

要約 この論文では、視覚センシングとライダーセンシングの両方を使用して構築された … 続きを読む

カテゴリー: cs.CV, cs.RO | Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations はコメントを受け付けていません

NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices

要約 リアルタイムの高精度オプティカル フロー推定は、現実世界のさまざまなアプリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices はコメントを受け付けていません

FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization

要約 階層的手法は最先端の視覚的位置特定を表し、グローバル記述子を使用して関連す … 続きを読む

カテゴリー: cs.CV, cs.RO | FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization はコメントを受け付けていません

LLM-enhanced Scene Graph Learning for Household Rearrangement

要約 家事の再配置タスクには、シーン内で置き忘れられた物体を見つけて、それらを適 … 続きを読む

カテゴリー: cs.CV, cs.RO | LLM-enhanced Scene Graph Learning for Household Rearrangement はコメントを受け付けていません

RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data

要約 大規模視覚言語モデル (LVLM) は人間の好みと一致しないことが多く、適 … 続きを読む

カテゴリー: cs.CL, cs.CV | RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data はコメントを受け付けていません

MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model

要約 このペーパーでは、マルチイメージ推論におけるマルチモーダル大規模言語モデル … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model はコメントを受け付けていません

GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections

要約 一般的なテキストから画像へのモデルは、芸術、デザイン、メディアの分野に革命 … 続きを読む

カテゴリー: cs.CV | GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections はコメントを受け付けていません

Class-balanced Open-set Semi-supervised Object Detection for Medical Images

要約 現実世界の医療画像データセットはラベルが付けられておらず、不均衡であること … 続きを読む

カテゴリー: cs.AI, cs.CV | Class-balanced Open-set Semi-supervised Object Detection for Medical Images はコメントを受け付けていません

SAM-SP: Self-Prompting Makes SAM Great Again

要約 最近導入された Visual Foundation Model (VFM) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET | SAM-SP: Self-Prompting Makes SAM Great Again はコメントを受け付けていません

Robust Principal Component Analysis via Discriminant Sample Weight Learning

要約 主成分分析 (PCA) は古典的な特徴抽出方法ですが、外れ値によって悪影響 … 続きを読む

カテゴリー: cs.CV, cs.LG | Robust Principal Component Analysis via Discriminant Sample Weight Learning はコメントを受け付けていません