月別アーカイブ: 2024年8月

RSB-Pose: Robust Short-Baseline Binocular 3D Human Pose Estimation with Occlusion Handling

要約 日常的に広く応用されている 3D 人間の姿勢推定の分野では、便利な取得装置 … 続きを読む

カテゴリー: cs.CV | RSB-Pose: Robust Short-Baseline Binocular 3D Human Pose Estimation with Occlusion Handling はコメントを受け付けていません

DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers

要約 ビジョン トランスフォーマー (ViT) は、ビジョン タスクにおけるパフ … 続きを読む

カテゴリー: cs.CV | DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers はコメントを受け付けていません

PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images

要約 単一の RGB 画像から 3D 形状を生成することは、ロボット工学などのさ … 続きを読む

カテゴリー: cs.CV | PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images はコメントを受け付けていません

TextIM: Part-aware Interactive Motion Synthesis from Text

要約 この研究では、パーツレベルのセマンティクスの正確な調整に焦点を当て、TEX … 続きを読む

カテゴリー: cs.CV | TextIM: Part-aware Interactive Motion Synthesis from Text はコメントを受け付けていません

Deep-learning Assisted Detection and Quantification of (oo)cysts of Giardia and Cryptosporidium on Smartphone Microscopy Images

要約 微生物に汚染された食品や水の摂取は、毎年何百万人もの人々の命を奪っています … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deep-learning Assisted Detection and Quantification of (oo)cysts of Giardia and Cryptosporidium on Smartphone Microscopy Images はコメントを受け付けていません

Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks

要約 エトルリアの鏡はエトルリア美術の重要なカテゴリーを構成しており、裏面に描か … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks はコメントを受け付けていません

Comprehensive Attribution: Inherently Explainable Vision Model with Feature Detector

要約 深視野モデルの人気が急速に高まるにつれ、モデル予測の説明がますます重要視さ … 続きを読む

カテゴリー: cs.CV | Comprehensive Attribution: Inherently Explainable Vision Model with Feature Detector はコメントを受け付けていません

MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture Generation

要約 拡散トランスの分野における最近の進歩により、高品質の 2D 画像、3D ビ … 続きを読む

カテゴリー: cs.CV | MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture Generation はコメントを受け付けていません

ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation

要約 このペーパーでは、オブジェクトとその色を一致させるマルチモーダル モデルの … 続きを読む

カテゴリー: cs.CL, cs.CV | ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation はコメントを受け付けていません

Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing

要約 ディープ ニューラル ネットワーク (DNN) が多くの計算問題に対する有 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.LO | Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing はコメントを受け付けていません