月別アーカイブ: 2023年3月

Scaling Vision-Language Models with Sparse Mixture of Experts

投稿日: 2023年3月14日作成者: jarxiv

要約自然言語処理 (NLP) の分野は、近年、特に大規模な視覚言語モデル (V … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Decompose, Adjust, Compose: Effective Normalization by Playing with Frequency for Domain Generalization

投稿日: 2023年3月14日作成者: jarxiv

要約ドメイン一般化 (DG) は、コンピュータービジョンモデルの堅牢性を評 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PMC-CLIP: Contrastive Language-Image Pre-training using Biomedical Documents

投稿日: 2023年3月14日作成者: jarxiv

要約大規模なデータセットでトレーニングされた Foundation モデルは、 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Validation of a photogrammetric approach for the objective study of ancient bowed instruments

投稿日: 2023年3月14日作成者: jarxiv

要約初期のヴァイオリンの中には、課せられた形態学的基準に適合するように歴史の中 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Surface-normal Based Neural Framework for Colonoscopy Reconstruction

投稿日: 2023年3月14日作成者: jarxiv

要約大腸内視鏡検査ビデオから 3D サーフェスを再構築することは、ビデオフレ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

InPL: Pseudo-labeling the Inliers First for Imbalanced Semi-supervised Learning

投稿日: 2023年3月14日作成者: jarxiv

要約不均衡な半教師あり学習 (SSL) における最近の最先端の方法は、一貫性の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images

投稿日: 2023年3月14日作成者: jarxiv

要約奇妙で奇妙で不気味なイメージは、常識に挑戦するため、観察者の好奇心を刺激し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

投稿日: 2023年3月14日作成者: jarxiv

要約オーディオビジュアルスピーチエンハンスメントは、オーディオ自体だけでなく、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Vision-Language Models as Success Detectors

投稿日: 2023年3月14日作成者: jarxiv

要約成功した行動を検出することは、インテリジェントエージェントのトレーニング … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Align and Attend: Multimodal Summarization with Dual Contrastive Losses

投稿日: 2023年3月14日作成者: jarxiv

要約マルチモーダル要約の目的は、さまざまなモダリティから最も重要な情報を抽出し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年3月

Scaling Vision-Language Models with Sparse Mixture of Experts

Decompose, Adjust, Compose: Effective Normalization by Playing with Frequency for Domain Generalization

PMC-CLIP: Contrastive Language-Image Pre-training using Biomedical Documents

Validation of a photogrammetric approach for the objective study of ancient bowed instruments

A Surface-normal Based Neural Framework for Colonoscopy Reconstruction

InPL: Pseudo-labeling the Inliers First for Imbalanced Semi-supervised Learning

Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

Vision-Language Models as Success Detectors

Align and Attend: Multimodal Summarization with Dual Contrastive Losses

最近の投稿

最近のコメント

アーカイブ

カテゴリー