月別アーカイブ: 2024年3月

Slovo: Russian Sign Language Dataset

投稿日: 2024年3月13日作成者: jarxiv

要約手話認識タスクの主な課題の 1 つは、難聴社会と聴者社会の間にあるギャップ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vivim: a Video Vision Mamba for Medical Video Object Segmentation

投稿日: 2024年3月13日作成者: jarxiv

要約従来の畳み込みニューラルネットワークの受容野は限られていますが、トランス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers

投稿日: 2024年3月13日作成者: jarxiv

要約このペーパーでは、複数の自己教師ありモデルからの特徴表現を活用する、教師な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Domain-Aware Continual Zero-Shot Learning

投稿日: 2024年3月13日作成者: jarxiv

要約現代の視覚システムには、種の発見の支援、野生動物の監視など、自然科学研究の … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Robust Synthetic-to-Real Transfer for Stereo Matching

投稿日: 2024年3月13日作成者: jarxiv

要約ドメイン汎用ステレオマッチングネットワークの進歩により、合成データで事 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Fast and Simple Explainability for Point Cloud Networks

投稿日: 2024年3月13日作成者: jarxiv

要約点群データに対する高速かつシンプルな説明可能な AI (XAI) 手法を提 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

投稿日: 2024年3月13日作成者: jarxiv

要約拡散モデルによる画像生成における目覚ましい成果を受けて、研究コミュニティは … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound

投稿日: 2024年3月13日作成者: jarxiv

要約自己教師あり学習 (SSL) は、ラベルのない画像から表現を学習することで … 続きを読む →

カテゴリー: cs.CV, eess.IV, I.2.10 | コメントを受け付けていません

Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis

投稿日: 2024年3月13日作成者: jarxiv

要約組織病理学的全スライド画像 (WSI) の分類は、医療顕微鏡画像処理の基礎 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-modal Auto-regressive Modeling via Visual Words

投稿日: 2024年3月13日作成者: jarxiv

要約大規模言語モデル (LLM) は、注釈のない大量のテキストコーパスに対し … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年3月

Slovo: Russian Sign Language Dataset

Vivim: a Video Vision Mamba for Medical Video Object Segmentation

CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers

Domain-Aware Continual Zero-Shot Learning

Robust Synthetic-to-Real Transfer for Stereo Matching

Fast and Simple Explainability for Point Cloud Networks

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound

Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis

Multi-modal Auto-regressive Modeling via Visual Words

最近の投稿

最近のコメント

アーカイブ

カテゴリー