-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2023年1月
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation
要約 ビジョン トランスフォーマーの導入以来、CNN によって圧倒的に支配されて … 続きを読む
カテゴリー: cs.CV
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation はコメントを受け付けていません
ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object Navigation
要約 特定のオブジェクトを正確に見つけてナビゲートする機能は、実世界で動作し、オ … 続きを読む
Shape-aware Text-driven Layered Video Editing
要約 ビデオ編集アプリケーションでは、時間的な一貫性が不可欠です。 ビデオの階層 … 続きを読む
Accurate Gaze Estimation using an Active-gaze Morphable Model
要約 画像から直接視線方向を回帰するのではなく、3D 形状モデルを追加すると、i … 続きを読む
カテゴリー: cs.CV
Accurate Gaze Estimation using an Active-gaze Morphable Model はコメントを受け付けていません
Extracting Training Data from Diffusion Models
要約 DALL-E 2、Imagen、Stable Diffusion などの画 … 続きを読む
Audio-Visual Segmentation with Semantics
要約 オーディオ ビジュアル セグメンテーション (AVS) と呼ばれる新しい問 … 続きを読む
カテゴリー: cs.CV
Audio-Visual Segmentation with Semantics はコメントを受け付けていません
Adaptive Computation with Elastic Input Sequence
要約 問題を解決するとき、人間は、使用する情報の種類、手順、および問題にアプロー … 続きを読む
Unlocking Slot Attention by Changing Optimal Transport Costs
要約 スロット アテンションは、画像やビデオでオブジェクト中心のモデリングを行う … 続きを読む
Image Restoration with Mean-Reverting Stochastic Differential Equations
要約 この論文では、汎用画像復元のための確率微分方程式 (SDE) アプローチを … 続きを読む
PCV: A Point Cloud-Based Network Verifier
要約 リアルタイムの LiDAR ベースの点群データを使用した 3D ビジョンは … 続きを読む