-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
RSB-Pose: Robust Short-Baseline Binocular 3D Human Pose Estimation with Occlusion Handling
要約 日常的に広く応用されている 3D 人間の姿勢推定の分野では、便利な取得装置 … 続きを読む
カテゴリー: cs.CV
RSB-Pose: Robust Short-Baseline Binocular 3D Human Pose Estimation with Occlusion Handling はコメントを受け付けていません
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers
要約 ビジョン トランスフォーマー (ViT) は、ビジョン タスクにおけるパフ … 続きを読む
カテゴリー: cs.CV
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers はコメントを受け付けていません
PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images
要約 単一の RGB 画像から 3D 形状を生成することは、ロボット工学などのさ … 続きを読む
カテゴリー: cs.CV
PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images はコメントを受け付けていません
TextIM: Part-aware Interactive Motion Synthesis from Text
要約 この研究では、パーツレベルのセマンティクスの正確な調整に焦点を当て、TEX … 続きを読む
カテゴリー: cs.CV
TextIM: Part-aware Interactive Motion Synthesis from Text はコメントを受け付けていません
Deep-learning Assisted Detection and Quantification of (oo)cysts of Giardia and Cryptosporidium on Smartphone Microscopy Images
要約 微生物に汚染された食品や水の摂取は、毎年何百万人もの人々の命を奪っています … 続きを読む
Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks
要約 エトルリアの鏡はエトルリア美術の重要なカテゴリーを構成しており、裏面に描か … 続きを読む
Comprehensive Attribution: Inherently Explainable Vision Model with Feature Detector
要約 深視野モデルの人気が急速に高まるにつれ、モデル予測の説明がますます重要視さ … 続きを読む
カテゴリー: cs.CV
Comprehensive Attribution: Inherently Explainable Vision Model with Feature Detector はコメントを受け付けていません
MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture Generation
要約 拡散トランスの分野における最近の進歩により、高品質の 2D 画像、3D ビ … 続きを読む
カテゴリー: cs.CV
MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture Generation はコメントを受け付けていません
ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation
要約 このペーパーでは、オブジェクトとその色を一致させるマルチモーダル モデルの … 続きを読む
Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing
要約 ディープ ニューラル ネットワーク (DNN) が多くの計算問題に対する有 … 続きを読む