-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos
要約 教育ビデオコンテンツでの視覚オブジェクト検出のための新しいベンチマークであ … 続きを読む
MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model
要約 マルチモーダルメディカルイメージングは、構造的および機能的なニューロイ … 続きを読む
ROSA: Harnessing Robot States for Vision-Language and Action Alignment
要約 ビジョン言語モデル(VLM)の強力な一般化能力により、ビジョン言語アクショ … 続きを読む
Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning
要約 この研究では、ECGシグナルからのハートビートの分類に対処します。2つの異 … 続きを読む
UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions
要約 ビデオデータセットの品質(画質、解像度、および細かいキャプション)は、ビデ … 続きを読む
カテゴリー: cs.CV
UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions はコメントを受け付けていません
Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry
要約 ビデオカメラの軌跡編集のための新しいフレームワークであるVID-CAMED … 続きを読む
カテゴリー: cs.CV
Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry はコメントを受け付けていません
Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data
要約 山火事は、生態系、野生生物、および人間のコミュニティに大きな脅威をもたらし … 続きを読む
How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection
要約 イベントカメラは、潜時が低い、時間分解能が高く、エネルギー効率が低いため、 … 続きを読む
カテゴリー: cs.CV
How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection はコメントを受け付けていません
OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning
要約 Transductive Zero-Shot Learning(ZSL)は … 続きを読む
カテゴリー: cs.CV
OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning はコメントを受け付けていません
Test3R: Learning to Reconstruct 3D at Test Time
要約 3D再構成のためのDust3R回帰ペアワイズポイントマップなどの密なマッチ … 続きを読む
カテゴリー: cs.CV
Test3R: Learning to Reconstruct 3D at Test Time はコメントを受け付けていません