月別アーカイブ: 2023年3月

CRIN: Rotation-Invariant Point Cloud Analysis and Rotation Estimation via Centrifugal Reference Frame

要約 最近の様々な手法は、入力された点の座標を相対的な距離や角度に置き換えること … 続きを読む

カテゴリー: cs.CV | CRIN: Rotation-Invariant Point Cloud Analysis and Rotation Estimation via Centrifugal Reference Frame はコメントを受け付けていません

CLIP the Gap: A Single Domain Generalization Approach for Object Detection

要約 単一領域汎化(SDG)は、単一のソース領域でモデルを学習し、それが未見のタ … 続きを読む

カテゴリー: cs.CV | CLIP the Gap: A Single Domain Generalization Approach for Object Detection はコメントを受け付けていません

DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting

要約 エンドツーエンドのテキストスポッティングは、シーンのテキスト検出と認識を統 … 続きを読む

カテゴリー: cs.CV | DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting はコメントを受け付けていません

ST-KeyS: Self-Supervised Transformer for Keyword Spotting in Historical Handwritten Documents

要約 歴史的な文書におけるキーワードスポッティング(KWS)は、デジタル化された … 続きを読む

カテゴリー: cs.CV | ST-KeyS: Self-Supervised Transformer for Keyword Spotting in Historical Handwritten Documents はコメントを受け付けていません

Video Question Answering Using CLIP-Guided Visual-Text Attention

要約 Video Question Answering (VideoQA)では、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, I.2.10 | Video Question Answering Using CLIP-Guided Visual-Text Attention はコメントを受け付けていません

Faster Learning of Temporal Action Proposal via Sparse Multilevel Boundary Generator

要約 動画像における時間的な行動定位は、コンピュータビジョンの分野において重要な … 続きを読む

カテゴリー: cs.AI, cs.CV | Faster Learning of Temporal Action Proposal via Sparse Multilevel Boundary Generator はコメントを受け付けていません

Understanding and Improving Visual Prompting: A Label-Mapping Perspective

要約 我々は、視覚タスクのための入力プロンプト技術であるビジュアルプロンプト(V … 続きを読む

カテゴリー: cs.CV | Understanding and Improving Visual Prompting: A Label-Mapping Perspective はコメントを受け付けていません

Provably Uncertainty-Guided Universal Domain Adaptation

要約 ユニバーサルドメインアダプテーション(UniDA)は、ラベルセットに関する … 続きを読む

カテゴリー: cs.CV | Provably Uncertainty-Guided Universal Domain Adaptation はコメントを受け付けていません

Neighborhood Contrastive Transformer for Change Captioning

要約 チェンジキャプションとは、類似した画像のペア間の意味的な変化を自然言語で記 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Neighborhood Contrastive Transformer for Change Captioning はコメントを受け付けていません

A System for Generalized 3D Multi-Object Search

要約 物体の探索は、ロボットにとって基本的なスキルである。そのため、物体探索は、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A System for Generalized 3D Multi-Object Search はコメントを受け付けていません