-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
要約 モノクラービデオから3Dシーンを効率的に再構築することは、仮想現実、ロボッ … 続きを読む
カテゴリー: cs.CV
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment はコメントを受け付けていません
Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression
要約 トレーニング前の手法は、コンピュータービジョンを大きく進めており、Croc … 続きを読む
カテゴリー: cs.CV
Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression はコメントを受け付けていません
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools
要約 世界を観察する能力は、環境と対話する方法について、推論と情報に基づいた決定 … 続きを読む
カテゴリー: cs.CV
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools はコメントを受け付けていません
VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models
要約 この研究では、ビジョン言語モデル(VLM)によって示される明示的および暗黙 … 続きを読む
Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation
要約 拡散モデルは、多様な自然分布全体で高解像度の現実的な画像を生成することに顕 … 続きを読む
Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru
要約 マルチモーダルの基礎モデルが自動運転車に実験的に展開され始めると、私たちが … 続きを読む
A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning
要約 事前に訓練されたビジョンモデル(PVM)は、最新のロボット工学の基本ですが … 続きを読む
Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition
要約 海上マルチシーン認識は、特に海洋保護、環境監視、災害対応などの用途で、イン … 続きを読む
Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark
要約 大幅な進歩にもかかわらず、自律駆動システムは、単一視点センシングの固有の制 … 続きを読む
RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations
要約 洗練された制御コマンドを直接生成してマルチモーダル感覚データを処理するエン … 続きを読む