-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2022年9月
Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding
要約 マルチモーダル トランスフォーマーは、画像とテキストを並べて視覚的な接地を … 続きを読む
カテゴリー: cs.CV
Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding はコメントを受け付けていません
3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions
要約 近年、符号付き距離をエンコードするニューラル ネットワークを介した暗黙的な … 続きを読む
Medical Image Captioning via Generative Pretrained Transformers
要約 自動臨床キャプション生成問題は、胸部正面 X 線スキャンの分析と放射線記録 … 続きを読む
RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation
要約 カテゴリ レベルのオブジェクト ポーズ推定は、既知の一連のカテゴリから任意 … 続きを読む
カテゴリー: cs.CV
RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation はコメントを受け付けていません
Towards Predicting Fine Finger Motions from Ultrasound Images via Kinematic Representation
要約 ロボット義足を構築する際の中心的な課題は、下肢から生理学的信号を読み取り、 … 続きを読む
A Review of Modern Approaches for Coronary Angiography Imaging Analysis
要約 冠状動脈性心疾患 (CHD) は、現代世界の主要な死因です。 CHD の診 … 続きを読む
Vision based Crop Row Navigation under Varying Field Conditions in Arable Fields
要約 正確な作物列の検出は、実際の耕地に存在するさまざまな圃場条件によってしばし … 続きを読む
Leveraging machine learning for less developed languages: Progress on Urdu text detection
要約 自然シーンの画像でのテキスト検出は、自動運転、高齢者や視覚障害者のナビゲー … 続きを読む
Motion Transformer for Unsupervised Image Animation
要約 イメージ アニメーションは、運転ビデオから学習したモーションを使用してソー … 続きを読む
カテゴリー: cs.CV
Motion Transformer for Unsupervised Image Animation はコメントを受け付けていません
Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation
要約 困難なタスクとして、テキストから画像への生成は、指定されたテキストの説明に … 続きを読む
カテゴリー: cs.CV
Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation はコメントを受け付けていません