-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations
要約 この論文では、視覚センシングとライダーセンシングの両方を使用して構築された … 続きを読む
NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices
要約 リアルタイムの高精度オプティカル フロー推定は、現実世界のさまざまなアプリ … 続きを読む
FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization
要約 階層的手法は最先端の視覚的位置特定を表し、グローバル記述子を使用して関連す … 続きを読む
LLM-enhanced Scene Graph Learning for Household Rearrangement
要約 家事の再配置タスクには、シーン内で置き忘れられた物体を見つけて、それらを適 … 続きを読む
RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data
要約 大規模視覚言語モデル (LVLM) は人間の好みと一致しないことが多く、適 … 続きを読む
MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model
要約 このペーパーでは、マルチイメージ推論におけるマルチモーダル大規模言語モデル … 続きを読む
GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections
要約 一般的なテキストから画像へのモデルは、芸術、デザイン、メディアの分野に革命 … 続きを読む
カテゴリー: cs.CV
GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections はコメントを受け付けていません
Class-balanced Open-set Semi-supervised Object Detection for Medical Images
要約 現実世界の医療画像データセットはラベルが付けられておらず、不均衡であること … 続きを読む
SAM-SP: Self-Prompting Makes SAM Great Again
要約 最近導入された Visual Foundation Model (VFM) … 続きを読む
Robust Principal Component Analysis via Discriminant Sample Weight Learning
要約 主成分分析 (PCA) は古典的な特徴抽出方法ですが、外れ値によって悪影響 … 続きを読む