-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
How Far Are We from Intelligent Visual Deductive Reasoning?
要約 視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む
Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving
要約 セマンティック セグメンテーションは、自動運転における重要な認識タスクです … 続きを読む
SVFAP: Self-supervised Video Facial Affect Perceiver
要約 ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む
Continual Learning in Medical Imaging: A Survey and Practical Analysis
要約 ディープラーニングは医療画像の再構築において大きな成功を収めていますが、広 … 続きを読む
カテゴリー: cs.CV
Continual Learning in Medical Imaging: A Survey and Practical Analysis はコメントを受け付けていません
Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning
要約 ジュニパーのような長命の大低木の分布とサイズを監視することは、地球規模の変 … 続きを読む
Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling
要約 この研究では、ビジュアル言語モデル (VLM) のトランスフォーマーを、シ … 続きを読む
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models
要約 テキストから画像への拡散モデル (SD) は、膨大な計算リソースを必要とす … 続きを読む
Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis
要約 あらゆる環境、あらゆる物体でシームレスに動作し、さまざまなスキルを活用して … 続きを読む
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection
要約 自動車シミュレーションは、コンピューター ビジョン アプリケーションにおけ … 続きを読む
カテゴリー: cs.CV
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection はコメントを受け付けていません
Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles
要約 異なるセンサー モダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む