月別アーカイブ: 2022年9月

Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding

要約 マルチモーダル トランスフォーマーは、画像とテキストを並べて視覚的な接地を … 続きを読む

カテゴリー: cs.CV | Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding はコメントを受け付けていません

3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions

要約 近年、符号付き距離をエンコードするニューラル ネットワークを介した暗黙的な … 続きを読む

カテゴリー: cs.CV, cs.GR | 3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions はコメントを受け付けていません

Medical Image Captioning via Generative Pretrained Transformers

要約 自動臨床キャプション生成問題は、胸部正面 X 線スキャンの分析と放射線記録 … 続きを読む

カテゴリー: cs.AI, cs.CV | Medical Image Captioning via Generative Pretrained Transformers はコメントを受け付けていません

RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation

要約 カテゴリ レベルのオブジェクト ポーズ推定は、既知の一連のカテゴリから任意 … 続きを読む

カテゴリー: cs.CV | RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation はコメントを受け付けていません

Towards Predicting Fine Finger Motions from Ultrasound Images via Kinematic Representation

要約 ロボット義足を構築する際の中心的な課題は、下肢から生理学的信号を読み取り、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Predicting Fine Finger Motions from Ultrasound Images via Kinematic Representation はコメントを受け付けていません

A Review of Modern Approaches for Coronary Angiography Imaging Analysis

要約 冠状動脈性心疾患 (CHD) は、現代世界の主要な死因です。 CHD の診 … 続きを読む

カテゴリー: cs.CV, eess.IV, I.4 | A Review of Modern Approaches for Coronary Angiography Imaging Analysis はコメントを受け付けていません

Vision based Crop Row Navigation under Varying Field Conditions in Arable Fields

要約 正確な作物列の検出は、実際の耕地に存在するさまざまな圃場条件によってしばし … 続きを読む

カテゴリー: cs.CV, cs.RO | Vision based Crop Row Navigation under Varying Field Conditions in Arable Fields はコメントを受け付けていません

Leveraging machine learning for less developed languages: Progress on Urdu text detection

要約 自然シーンの画像でのテキスト検出は、自動運転、高齢者や視覚障害者のナビゲー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Leveraging machine learning for less developed languages: Progress on Urdu text detection はコメントを受け付けていません

Motion Transformer for Unsupervised Image Animation

要約 イメージ アニメーションは、運転ビデオから学習したモーションを使用してソー … 続きを読む

カテゴリー: cs.CV | Motion Transformer for Unsupervised Image Animation はコメントを受け付けていません

Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation

要約 困難なタスクとして、テキストから画像への生成は、指定されたテキストの説明に … 続きを読む

カテゴリー: cs.CV | Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation はコメントを受け付けていません