月別アーカイブ: 2022年8月

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

投稿日: 2022年8月19日作成者: jarxiv

要約 Grounded Situation Recognition (GSR) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Open-Vocabulary Panoptic Segmentation with MaskCLIP

投稿日: 2022年8月19日作成者: jarxiv

要約この論文では、テキストベースの説明の任意のカテゴリに対してパノプティック … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The 8-Point Algorithm as an Inductive Bias for Relative Pose Prediction by ViTs

投稿日: 2022年8月19日作成者: jarxiv

要約 2 つの画像間の相対的な姿勢 (スケールを含む回転と平行移動) を直接推定 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Auto-segmentation of Hip Joints using MultiPlanar UNet with Transfer learning

投稿日: 2022年8月19日作成者: jarxiv

要約有限要素モデルの開発には、正確なジオメトリ表現が不可欠です。一般的には優 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

ILLUME: Rationalizing Vision-Language Models by Interacting with their Jabber

投稿日: 2022年8月19日作成者: jarxiv

要約事前トレーニング済み言語モデルからのブートストラップは、画像キャプションや … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

Video-TransUNet: Temporally Blended Vision Transformer for CT VFSS Instance Segmentation

投稿日: 2022年8月19日作成者: jarxiv

要約 TransUNet 深層学習フレームワークに時間的特徴ブレンディングを統合 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Road detection via a dual-task network based on cross-layer graph fusion modules

投稿日: 2022年8月18日作成者: jarxiv

要約リモートセンシング画像に基づく道路検出は、インテリジェントな交通管理にと … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Extreme-scale Talking-Face Video Upsampling with Audio-Visual Priors

投稿日: 2022年8月18日作成者: jarxiv

要約この論文では、$8\times8$ ピクセルのビデオシーケンスから何が得 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

投稿日: 2022年8月18日作成者: jarxiv

要約オブジェクト検出は、コンピュータービジョンにおける重要なダウンストリーム … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Benchmark and Asymmetrical-Similarity Learning for Practical Image Copy Detection

投稿日: 2022年8月18日作成者: jarxiv

要約画像コピー検出 (ICD) は、クエリ画像が参照セットからの画像の編集済み … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2022年8月

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

Open-Vocabulary Panoptic Segmentation with MaskCLIP

The 8-Point Algorithm as an Inductive Bias for Relative Pose Prediction by ViTs

Auto-segmentation of Hip Joints using MultiPlanar UNet with Transfer learning

ILLUME: Rationalizing Vision-Language Models by Interacting with their Jabber

Video-TransUNet: Temporally Blended Vision Transformer for CT VFSS Instance Segmentation

Road detection via a dual-task network based on cross-layer graph fusion modules

Extreme-scale Talking-Face Video Upsampling with Audio-Visual Priors

Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

A Benchmark and Asymmetrical-Similarity Learning for Practical Image Copy Detection

最近の投稿

最近のコメント

アーカイブ

カテゴリー