月別アーカイブ: 2024年5月

Provably Robust Conformal Prediction with Improved Efficiency

要約 等角予測は、トレーニング データとテスト データが i.i.d. であると … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Provably Robust Conformal Prediction with Improved Efficiency はコメントを受け付けていません

VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization

要約 画像またはビデオシーケンスからテキスト情報を抽出するタスクであるテキストス … 続きを読む

カテゴリー: cs.AI, cs.CV | VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization はコメントを受け付けていません

Masked Multi-Query Slot Attention for Unsupervised Object Discovery

要約 教師なし物体発見は、セマンティック セグメンテーションや物体検出など、画像 … 続きを読む

カテゴリー: cs.CV, cs.LG | Masked Multi-Query Slot Attention for Unsupervised Object Discovery はコメントを受け付けていません

Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder

要約 自動読唇術 (ALR) は、ビデオにキャプチャされた話者の無言の唇の動きか … 続きを読む

カテゴリー: cs.CV | Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder はコメントを受け付けていません

Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving

要約 深層学習モデルの機能を定義する際のデータセットの基本的な役割により、その急 … 続きを読む

カテゴリー: cs.CV | Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving はコメントを受け付けていません

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

要約 Segment Anything Model (SAM) と CLIP は … 続きを読む

カテゴリー: cs.AI, cs.CV | Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation はコメントを受け付けていません

Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity

要約 画質評価は主観的な実験で被験者によって提供された生の意見スコアに依存するこ … 続きを読む

カテゴリー: cs.CV, eess.IV | Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity はコメントを受け付けていません

SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration

要約 敵対的生成ネットワーク (GAN) を使用して優先画像を生成することは、潜 … 続きを読む

カテゴリー: cs.CV, cs.HC | SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration はコメントを受け付けていません

Naturally Supervised 3D Visual Grounding with Language-Regularized Concept Learners

要約 3D 視覚的グラウンディングは、多くの場合、直接的かつ綿密な監視、特にシー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Naturally Supervised 3D Visual Grounding with Language-Regularized Concept Learners はコメントを受け付けていません

GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting

要約 我々は、単一の A100 GPU で 2 ~ 4 枚のポーズをとったスパー … 続きを読む

カテゴリー: cs.CV | GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting はコメントを受け付けていません