月別アーカイブ: 2024年5月

Deep Network Pruning: A Comparative Study on CNNs in Face Recognition

要約 あらゆる種類の取引にモバイル デバイスが広く使用されるようになったことで、 … 続きを読む

カテゴリー: cs.CV | Deep Network Pruning: A Comparative Study on CNNs in Face Recognition はコメントを受け付けていません

Multi-modal Generation via Cross-Modal In-Context Learning

要約 この研究では、複雑なマルチモーダル プロンプト シーケンスから新しい画像を … 続きを読む

カテゴリー: cs.CV | Multi-modal Generation via Cross-Modal In-Context Learning はコメントを受け付けていません

Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI

要約 視覚刺激中に収集された fMRI データから被験者が観察した画像の再構成は … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI はコメントを受け付けていません

Self-Supervised Learning Based Handwriting Verification

要約 手書き検証のタスクに適用される SSL-HV: 自己教師あり学習アプローチ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Self-Supervised Learning Based Handwriting Verification はコメントを受け付けていません

SCE-MAE: Selective Correspondence Enhancement with Masked Autoencoder for Self-Supervised Landmark Estimation

要約 自己教師ありランドマーク推定は、注釈付きデータがない場合にまばらな顔のラン … 続きを読む

カテゴリー: cs.AI, cs.CV | SCE-MAE: Selective Correspondence Enhancement with Masked Autoencoder for Self-Supervised Landmark Estimation はコメントを受け付けていません

VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers

要約 ビデオ試着は、現実世界での大きな可能性を秘めた有望な分野です。 これまでの … 続きを読む

カテゴリー: cs.CV | VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers はコメントを受け付けていません

Histopathology Based AI Model Predicts Anti-Angiogenic Therapy Response in Renal Cancer Clinical Trial

要約 血管新生阻害剤、免疫チェックポイント阻害剤、mTOR阻害剤、HIF2阻害剤 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | Histopathology Based AI Model Predicts Anti-Angiogenic Therapy Response in Renal Cancer Clinical Trial はコメントを受け付けていません

Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment

要約 Visual and Language Pretraining (VLP) … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment はコメントを受け付けていません

Frustratingly Easy Test-Time Adaptation of Vision-Language Models

要約 視覚言語モデルは、任意の意味カテゴリをシームレスに識別しますが、それでも、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Frustratingly Easy Test-Time Adaptation of Vision-Language Models はコメントを受け付けていません

SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches

要約 このペーパーでは、スケッチベースのクエリ インターフェイスを使用してビデオ … 続きを読む

カテゴリー: cs.CV, cs.DB, cs.LG | SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches はコメントを受け付けていません