月別アーカイブ: 2024年5月

Provably Robust Conformal Prediction with Improved Efficiency

投稿日: 2024年5月1日作成者: jarxiv

要約等角予測は、トレーニングデータとテストデータが i.i.d. であると … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization

投稿日: 2024年5月1日作成者: jarxiv

要約画像またはビデオシーケンスからテキスト情報を抽出するタスクであるテキストス … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Masked Multi-Query Slot Attention for Unsupervised Object Discovery

投稿日: 2024年5月1日作成者: jarxiv

要約教師なし物体発見は、セマンティックセグメンテーションや物体検出など、画像 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder

投稿日: 2024年5月1日作成者: jarxiv

要約自動読唇術 (ALR) は、ビデオにキャプチャされた話者の無言の唇の動きか … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving

投稿日: 2024年5月1日作成者: jarxiv

要約深層学習モデルの機能を定義する際のデータセットの基本的な役割により、その急 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

投稿日: 2024年5月1日作成者: jarxiv

要約 Segment Anything Model (SAM) と CLIP は … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity

投稿日: 2024年5月1日作成者: jarxiv

要約画質評価は主観的な実験で被験者によって提供された生の意見スコアに依存するこ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration

投稿日: 2024年5月1日作成者: jarxiv

要約敵対的生成ネットワーク (GAN) を使用して優先画像を生成することは、潜 … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Naturally Supervised 3D Visual Grounding with Language-Regularized Concept Learners

投稿日: 2024年5月1日作成者: jarxiv

要約 3D 視覚的グラウンディングは、多くの場合、直接的かつ綿密な監視、特にシー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting

投稿日: 2024年5月1日作成者: jarxiv

要約我々は、単一の A100 GPU で 2 ～ 4 枚のポーズをとったスパー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年5月

Provably Robust Conformal Prediction with Improved Efficiency

VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization

Masked Multi-Query Slot Attention for Unsupervised Object Discovery

Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder

Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity

SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration

Naturally Supervised 3D Visual Grounding with Language-Regularized Concept Learners

GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting

最近の投稿

最近のコメント

アーカイブ

カテゴリー