-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Extracting Training Data from Document-Based VQA Models
要約 ビジョン言語モデル (VLM) は、ドキュメントベースの視覚的な質問応答 … 続きを読む
OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects
要約 私たちは、3D 正規化オブジェクト座標空間 (NOCS) マップ、オブジェ … 続きを読む
Defect Spectrum: A Granular Look of Large-Scale Defect Datasets with Rich Semantics
要約 欠陥検査は閉ループ製造システム内で最も重要です。 ただし、欠陥検査用の既存 … 続きを読む
カテゴリー: cs.CV
Defect Spectrum: A Granular Look of Large-Scale Defect Datasets with Rich Semantics はコメントを受け付けていません
CoR-GS: Sparse-View 3D Gaussian Splatting via Co-Regularization
要約 3D ガウス スプラッティング (3DGS) は、シーンを表す 3D ガウ … 続きを読む
カテゴリー: cs.CV
CoR-GS: Sparse-View 3D Gaussian Splatting via Co-Regularization はコメントを受け付けていません
WhisperNetV2: SlowFast Siamese Network For Lip-Based Biometrics
要約 口唇ベースの生体認証 (LBBA) は、過去 10 年間に多くの研究者を魅 … 続きを読む
Unifying 3D Representation and Control of Diverse Robots with a Single Camera
要約 自然生物の複雑な構造と多様な機能を反映することは、ロボット工学における長年 … 続きを読む
MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces
要約 街並みや広場などの公共の都市空間は、住民にサービスを提供し、あらゆる活気に … 続きを読む
Map It Anywhere (MIA): Empowering Bird’s Eye View Mapping using Large-scale Public Data
要約 トップダウンの鳥瞰図 (BEV) マップは、下流タスクの豊富さと柔軟性によ … 続きを読む
カテゴリー: cs.CV
Map It Anywhere (MIA): Empowering Bird’s Eye View Mapping using Large-scale Public Data はコメントを受け付けていません
Beyond Aesthetics: Cultural Competence in Text-to-Image Models
要約 Text-to-Image (T2I) モデルは、独自の文化を視覚的に表現 … 続きを読む
カテゴリー: cs.CV
Beyond Aesthetics: Cultural Competence in Text-to-Image Models はコメントを受け付けていません
BiEquiFormer: Bi-Equivariant Representations for Global Point Cloud Registration
要約 この論文の目的は、\textit{global} 点群登録 (PCR) の … 続きを読む