月別アーカイブ: 2022年9月

Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding

投稿日: 2022年9月29日作成者: jarxiv

要約マルチモーダルトランスフォーマーは、画像とテキストを並べて視覚的な接地を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions

投稿日: 2022年9月29日作成者: jarxiv

要約近年、符号付き距離をエンコードするニューラルネットワークを介した暗黙的な … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Medical Image Captioning via Generative Pretrained Transformers

投稿日: 2022年9月29日作成者: jarxiv

要約自動臨床キャプション生成問題は、胸部正面 X 線スキャンの分析と放射線記録 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation

投稿日: 2022年9月29日作成者: jarxiv

要約カテゴリレベルのオブジェクトポーズ推定は、既知の一連のカテゴリから任意 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Predicting Fine Finger Motions from Ultrasound Images via Kinematic Representation

投稿日: 2022年9月29日作成者: jarxiv

要約ロボット義足を構築する際の中心的な課題は、下肢から生理学的信号を読み取り、 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

A Review of Modern Approaches for Coronary Angiography Imaging Analysis

投稿日: 2022年9月29日作成者: jarxiv

要約冠状動脈性心疾患 (CHD) は、現代世界の主要な死因です。 CHD の診 … 続きを読む →

カテゴリー: cs.CV, eess.IV, I.4 | コメントを受け付けていません

Vision based Crop Row Navigation under Varying Field Conditions in Arable Fields

投稿日: 2022年9月29日作成者: jarxiv

要約正確な作物列の検出は、実際の耕地に存在するさまざまな圃場条件によってしばし … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Leveraging machine learning for less developed languages: Progress on Urdu text detection

投稿日: 2022年9月29日作成者: jarxiv

要約自然シーンの画像でのテキスト検出は、自動運転、高齢者や視覚障害者のナビゲー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Motion Transformer for Unsupervised Image Animation

投稿日: 2022年9月29日作成者: jarxiv

要約イメージアニメーションは、運転ビデオから学習したモーションを使用してソー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation

投稿日: 2022年9月29日作成者: jarxiv

要約困難なタスクとして、テキストから画像への生成は、指定されたテキストの説明に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2022年9月

Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding

3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions

Medical Image Captioning via Generative Pretrained Transformers

RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation

Towards Predicting Fine Finger Motions from Ultrasound Images via Kinematic Representation

A Review of Modern Approaches for Coronary Angiography Imaging Analysis

Vision based Crop Row Navigation under Varying Field Conditions in Arable Fields

Leveraging machine learning for less developed languages: Progress on Urdu text detection

Motion Transformer for Unsupervised Image Animation

Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー