-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Active InSAR monitoring of building damage in Gaza during the Israel-Hamas War
要約 2023年10月7日から始まるガザ地区の空中爆撃は、21世紀の最も激しい爆 … 続きを読む
カテゴリー: cs.CV
Active InSAR monitoring of building damage in Gaza during the Israel-Hamas War はコメントを受け付けていません
SyncTalk++: High-Fidelity and Efficient Synchronized Talking Heads Synthesis Using Gaussian Splatting
要約 現実的で音声駆動型のトーキングヘッドビデオの統合において高い同期を達成する … 続きを読む
カテゴリー: cs.CV
SyncTalk++: High-Fidelity and Efficient Synchronized Talking Heads Synthesis Using Gaussian Splatting はコメントを受け付けていません
Cost-Aware Routing for Efficient Text-To-Image Generation
要約 拡散モデルは、反復的な除去プロセスを介して入力プロンプトの高忠実度画像を生 … 続きを読む
Scaling-Up the Pretraining of the Earth Observation Foundation Model PhilEO to the MajorTOM Dataset
要約 今日、地球観測(EO)衛星は大量のデータを生成し、コペルニクスセンチネル2 … 続きを読む
カテゴリー: cs.CV
Scaling-Up the Pretraining of the Earth Observation Foundation Model PhilEO to the MajorTOM Dataset はコメントを受け付けていません
ASCD: Attention-Steerable Contrastive Decoding for Reducing Hallucination in MLLM
要約 マルチモーダル大手言語モデル(MLLM)はしばしば幻覚に苦しんでいます。 … 続きを読む
CDP: Towards Robust Autoregressive Visuomotor Policy Learning via Causal Diffusion
要約 拡散ポリシー(DP)により、ロボットはアクション拡散を通じて専門家のデモを … 続きを読む
Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos
要約 教育ビデオコンテンツでの視覚オブジェクト検出のための新しいベンチマークであ … 続きを読む
VideoPDE: Unified Generative PDE Solving via Video Inpainting Diffusion Models
要約 ビデオインペインティング拡散トランスモデルを使用して、部分微分方程式(PD … 続きを読む
SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure
要約 視覚的な同時ローカリゼーションとマッピング(SLAM)は、極端な視点、スケ … 続きを読む
A Novel ViDAR Device With Visual Inertial Encoder Odometry and Reinforcement Learning-Based Active SLAM Method
要約 同時ローカリゼーションとマッピング(SLAM)のためのマルチセンサー融合の … 続きを読む