月別アーカイブ: 2022年8月

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

要約 Grounded Situation Recognition (GSR) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement はコメントを受け付けていません

Open-Vocabulary Panoptic Segmentation with MaskCLIP

要約 この論文では、テキストベースの説明の任意のカテゴリに対してパノプティック … 続きを読む

カテゴリー: cs.CV | Open-Vocabulary Panoptic Segmentation with MaskCLIP はコメントを受け付けていません

The 8-Point Algorithm as an Inductive Bias for Relative Pose Prediction by ViTs

要約 2 つの画像間の相対的な姿勢 (スケールを含む回転と平行移動) を直接推定 … 続きを読む

カテゴリー: cs.CV | The 8-Point Algorithm as an Inductive Bias for Relative Pose Prediction by ViTs はコメントを受け付けていません

Auto-segmentation of Hip Joints using MultiPlanar UNet with Transfer learning

要約 有限要素モデルの開発には、正確なジオメトリ表現が不可欠です。 一般的には優 … 続きを読む

カテゴリー: cs.CV, eess.IV | Auto-segmentation of Hip Joints using MultiPlanar UNet with Transfer learning はコメントを受け付けていません

ILLUME: Rationalizing Vision-Language Models by Interacting with their Jabber

要約 事前トレーニング済み言語モデルからのブートストラップは、画像キャプションや … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | ILLUME: Rationalizing Vision-Language Models by Interacting with their Jabber はコメントを受け付けていません

Video-TransUNet: Temporally Blended Vision Transformer for CT VFSS Instance Segmentation

要約 TransUNet 深層学習フレームワークに時間的特徴ブレンディングを統合 … 続きを読む

カテゴリー: cs.CV, eess.IV | Video-TransUNet: Temporally Blended Vision Transformer for CT VFSS Instance Segmentation はコメントを受け付けていません

Road detection via a dual-task network based on cross-layer graph fusion modules

要約 リモート センシング画像に基づく道路検出は、インテリジェントな交通管理にと … 続きを読む

カテゴリー: cs.CV | Road detection via a dual-task network based on cross-layer graph fusion modules はコメントを受け付けていません

Extreme-scale Talking-Face Video Upsampling with Audio-Visual Priors

要約 この論文では、$8\times8$ ピクセルのビデオ シーケンスから何が得 … 続きを読む

カテゴリー: cs.CV | Extreme-scale Talking-Face Video Upsampling with Audio-Visual Priors はコメントを受け付けていません

Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

要約 オブジェクト検出は、コンピューター ビジョンにおける重要なダウンストリーム … 続きを読む

カテゴリー: cs.CV | Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles はコメントを受け付けていません

A Benchmark and Asymmetrical-Similarity Learning for Practical Image Copy Detection

要約 画像コピー検出 (ICD) は、クエリ画像が参照セットからの画像の編集済み … 続きを読む

カテゴリー: cs.CV | A Benchmark and Asymmetrical-Similarity Learning for Practical Image Copy Detection はコメントを受け付けていません