月別アーカイブ: 2023年4月

Img2Vec: A Teacher of High Token-Diversity Helps Masked AutoEncoders

要約 【タイトル】 Img2Vec:トークン多様性の高い教師がマスクされたオート … 続きを読む

カテゴリー: cs.CV | Img2Vec: A Teacher of High Token-Diversity Helps Masked AutoEncoders はコメントを受け付けていません

Text-guided Eyeglasses Manipulation with Spatial Constraints

要約 タイトル:空間制約を伴ったテキスト誘導型メガネの操作 要約: &#8211 … 続きを読む

カテゴリー: cs.CV | Text-guided Eyeglasses Manipulation with Spatial Constraints はコメントを受け付けていません

Object Semantics Give Us the Depth We Need: Multi-task Approach to Aerial Depth Completion

要約 タイトル:物体セマンティクスによって深度補完に必要な推定が可能になる:航空 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, I.2.10 | Object Semantics Give Us the Depth We Need: Multi-task Approach to Aerial Depth Completion はコメントを受け付けていません

Solving relaxations of MAP-MRF problems: Combinatorial in-face Frank-Wolfe directions

要約 タイトル:MAP-MRF問題の緩和を解決する:組合せ的な面内フランク・ウル … 続きを読む

カテゴリー: cs.CV, cs.LG, math.OC | Solving relaxations of MAP-MRF problems: Combinatorial in-face Frank-Wolfe directions はコメントを受け付けていません

SwinFSR: Stereo Image Super-Resolution using SwinIR and Frequency Domain Knowledge

要約 タイトル:SwinFSR:SwinIRと周波数領域知識を使用したステレオイ … 続きを読む

カテゴリー: cs.CV | SwinFSR: Stereo Image Super-Resolution using SwinIR and Frequency Domain Knowledge はコメントを受け付けていません

Interaction Visual Transformer for Egocentric Action Anticipation

要約 タイトル:予測的な自己中心的なアクションのためのインタラクションビジュアル … 続きを読む

カテゴリー: cs.CV | Interaction Visual Transformer for Egocentric Action Anticipation はコメントを受け付けていません

TCR: Short Video Title Generation and Cover Selection with Attention Refinement

要約 タイトル:TCR:アテンションリファインメントによる短い動画のタイトル生成 … 続きを読む

カテゴリー: cs.CV, cs.MM | TCR: Short Video Title Generation and Cover Selection with Attention Refinement はコメントを受け付けていません

Learnable Pillar-based Re-ranking for Image-Text Retrieval

要約 タイトル:学習可能な柱ベースの再ランキングによる画像-テキスト検索 要約: … 続きを読む

カテゴリー: cs.CV, cs.IR | Learnable Pillar-based Re-ranking for Image-Text Retrieval はコメントを受け付けていません

Data Level Lottery Ticket Hypothesis for Vision Transformers

要約 タイトル:Vision Transformerのためのデータレベル抽選券仮 … 続きを読む

カテゴリー: cs.CV, cs.LG | Data Level Lottery Ticket Hypothesis for Vision Transformers はコメントを受け付けていません

Bit Allocation using Optimization

要約 タイトル:最適化を用いたビット割り当て 要約:この論文では、ニューラルビデ … 続きを読む

カテゴリー: cs.CV | Bit Allocation using Optimization はコメントを受け付けていません