「cs.CV」カテゴリーアーカイブ

Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations

投稿日: 2024年8月23日作成者: jarxiv

要約この論文では、視覚センシングとライダーセンシングの両方を使用して構築された … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices

投稿日: 2024年8月23日作成者: jarxiv

要約リアルタイムの高精度オプティカルフロー推定は、現実世界のさまざまなアプリ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization

投稿日: 2024年8月23日作成者: jarxiv

要約階層的手法は最先端の視覚的位置特定を表し、グローバル記述子を使用して関連す … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

LLM-enhanced Scene Graph Learning for Household Rearrangement

投稿日: 2024年8月23日作成者: jarxiv

要約家事の再配置タスクには、シーン内で置き忘れられた物体を見つけて、それらを適 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data

投稿日: 2024年8月23日作成者: jarxiv

要約大規模視覚言語モデル (LVLM) は人間の好みと一致しないことが多く、適 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model

投稿日: 2024年8月23日作成者: jarxiv

要約このペーパーでは、マルチイメージ推論におけるマルチモーダル大規模言語モデル … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM | コメントを受け付けていません

GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections

投稿日: 2024年8月23日作成者: jarxiv

要約一般的なテキストから画像へのモデルは、芸術、デザイン、メディアの分野に革命 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Class-balanced Open-set Semi-supervised Object Detection for Medical Images

投稿日: 2024年8月23日作成者: jarxiv

要約現実世界の医療画像データセットはラベルが付けられておらず、不均衡であること … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SAM-SP: Self-Prompting Makes SAM Great Again

投稿日: 2024年8月23日作成者: jarxiv

要約最近導入された Visual Foundation Model (VFM) … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.ET | コメントを受け付けていません

Robust Principal Component Analysis via Discriminant Sample Weight Learning

投稿日: 2024年8月23日作成者: jarxiv

要約主成分分析 (PCA) は古典的な特徴抽出方法ですが、外れ値によって悪影響 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations

NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices

FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization

LLM-enhanced Scene Graph Learning for Household Rearrangement

RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data

MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model

GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections

Class-balanced Open-set Semi-supervised Object Detection for Medical Images

SAM-SP: Self-Prompting Makes SAM Great Again

Robust Principal Component Analysis via Discriminant Sample Weight Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー