-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Reconstructing Hand-Held Objects in 3D from Images and Videos
要約 手で操作されるオブジェクト (マニピュランダ) は、インターネット ビデオ … 続きを読む
カテゴリー: cs.CV
Reconstructing Hand-Held Objects in 3D from Images and Videos はコメントを受け付けていません
Quark: Real-time, High-resolution, and General Neural View Synthesis
要約 我々は、高品質、高解像度、リアルタイムの新規ビュー合成を実行するための新し … 続きを読む
Factorized Visual Tokenization and Generation
要約 ビジュアルトークナイザーは画像生成の基礎です。 視覚データを個別のトークン … 続きを読む
カテゴリー: cs.CV
Factorized Visual Tokenization and Generation はコメントを受け付けていません
Generative Omnimatte: Learning to Decompose Video into Layers
要約 ビデオと一連の入力オブジェクト マスクが与えられると、オムニマット手法は、 … 続きを読む
カテゴリー: cs.CV
Generative Omnimatte: Learning to Decompose Video into Layers はコメントを受け付けていません
OminiControl: Minimal and Universal Control for Diffusion Transformer
要約 このペーパーでは、画像条件を事前トレーニング済みの拡散変換 (DiT) モ … 続きを読む
VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving
要約 この論文では、自動運転におけるビジョン中心のアルゴリズム用に設計された新し … 続きを読む
TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior
要約 自動運転システムの最近の進歩は、アノテーションとメンテナンスに莫大なコスト … 続きを読む
A Benchmark Dataset for Collaborative SLAM in Service Environments
要約 サービス環境の多様化に伴い、1台のロボットでは難しい複雑な作業が求められる … 続きを読む
FastGrasp: Efficient Grasp Synthesis with Diffusion
要約 人間の手と物体の相互作用を効果的にモデル化することは、複雑な物理的制約とア … 続きを読む
Unsupervised Multi-view UAV Image Geo-localization via Iterative Rendering
要約 無人航空機 (UAV) のクロスビュー地理位置特定 (CVGL) には、斜 … 続きを読む