月別アーカイブ: 2023年7月

Layout and Task Aware Instruction Prompt for Zero-shot Document Image Question Answering

要約 レイアウトを意識したマルチモーダルな事前トレーニング済みモデルに基づく事前 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Layout and Task Aware Instruction Prompt for Zero-shot Document Image Question Answering はコメントを受け付けていません

Miniaturized Graph Convolutional Networks with Topologically Consistent Pruning

要約 マグニチュード プルーニングは、軽量アーキテクチャ設計における主流の手法の … 続きを読む

カテゴリー: cs.CV | Miniaturized Graph Convolutional Networks with Topologically Consistent Pruning はコメントを受け付けていません

RBSR: Efficient and Flexible Recurrent Network for Burst Super-Resolution

要約 バースト超解像度 (BurstSR) は、一連の低解像度 (LR) でノイ … 続きを読む

カテゴリー: cs.CV | RBSR: Efficient and Flexible Recurrent Network for Burst Super-Resolution はコメントを受け付けていません

Razor SNN: Efficient Spiking Neural Network with Temporal Embeddings

要約 ダイナミック ビジョン センサー (DVS) によって生成されるイベント … 続きを読む

カテゴリー: cs.AI, cs.CV | Razor SNN: Efficient Spiking Neural Network with Temporal Embeddings はコメントを受け付けていません

S.T.A.R.-Track: Latent Motion Models for End-to-End 3D Object Tracking with Adaptive Spatio-Temporal Appearance Representations

要約 このペーパーでは、注意による追跡パラダイムに従って、3D で追跡するための … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | S.T.A.R.-Track: Latent Motion Models for End-to-End 3D Object Tracking with Adaptive Spatio-Temporal Appearance Representations はコメントを受け付けていません

A Unified Object Counting Network with Object Occupation Prior

要約 カウント タスクは、多くのアプリケーション (群衆カウント、交通統計など) … 続きを読む

カテゴリー: cs.CV | A Unified Object Counting Network with Object Occupation Prior はコメントを受け付けていません

Polarimetric iToF: Measuring High-Fidelity Depth through Scattering Media

要約 間接飛行時間型 (iToF) イメージングにより、低コストで高密度の深度情 … 続きを読む

カテゴリー: cs.CV | Polarimetric iToF: Measuring High-Fidelity Depth through Scattering Media はコメントを受け付けていません

Sphere2Vec: A General-Purpose Location Representation Learning over a Spherical Surface for Large-Scale Geospatial Predictions

要約 空間内の点について学習しやすい表現を生成することは、ML における長年にわ … 続きを読む

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, cs.LG, I.2.0 | Sphere2Vec: A General-Purpose Location Representation Learning over a Spherical Surface for Large-Scale Geospatial Predictions はコメントを受け付けていません

Achieving RGB-D level Segmentation Performance from a Single ToF Camera

要約 深度はコンピュータ ビジョンにおいて非常に重要なモダリティであり、通常、R … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Achieving RGB-D level Segmentation Performance from a Single ToF Camera はコメントを受け付けていません

Learning Homeomorphic Image Registration via Conformal-Invariant Hyperelastic Regularisation

要約 変形可能な画像の位置合わせは、医用画像解析の基本的なタスクであり、幅広い臨 … 続きを読む

カテゴリー: cs.CV, eess.IV | Learning Homeomorphic Image Registration via Conformal-Invariant Hyperelastic Regularisation はコメントを受け付けていません