月別アーカイブ: 2024年3月

Slovo: Russian Sign Language Dataset

要約 手話認識タスクの主な課題の 1 つは、難聴社会と聴者社会の間にあるギャップ … 続きを読む

カテゴリー: cs.CV | Slovo: Russian Sign Language Dataset はコメントを受け付けていません

Vivim: a Video Vision Mamba for Medical Video Object Segmentation

要約 従来の畳み込みニューラル ネットワークの受容野は限られていますが、トランス … 続きを読む

カテゴリー: cs.CV | Vivim: a Video Vision Mamba for Medical Video Object Segmentation はコメントを受け付けていません

CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers

要約 このペーパーでは、複数の自己教師ありモデルからの特徴表現を活用する、教師な … 続きを読む

カテゴリー: cs.CV | CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers はコメントを受け付けていません

Domain-Aware Continual Zero-Shot Learning

要約 現代の視覚システムには、種の発見の支援、野生動物の監視など、自然科学研究の … 続きを読む

カテゴリー: cs.CV, cs.LG | Domain-Aware Continual Zero-Shot Learning はコメントを受け付けていません

Robust Synthetic-to-Real Transfer for Stereo Matching

要約 ドメイン汎用ステレオ マッチング ネットワークの進歩により、合成データで事 … 続きを読む

カテゴリー: cs.CV | Robust Synthetic-to-Real Transfer for Stereo Matching はコメントを受け付けていません

Fast and Simple Explainability for Point Cloud Networks

要約 点群データに対する高速かつシンプルな説明可能な AI (XAI) 手法を提 … 続きを読む

カテゴリー: cs.CV, cs.LG | Fast and Simple Explainability for Point Cloud Networks はコメントを受け付けていません

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

要約 拡散モデルによる画像生成における目覚ましい成果を受けて、研究コミュニティは … 続きを読む

カテゴリー: cs.AI, cs.CV | SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces はコメントを受け付けていません

Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound

要約 自己教師あり学習 (SSL) は、ラベルのない画像から表現を学習することで … 続きを読む

カテゴリー: cs.CV, eess.IV, I.2.10 | Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound はコメントを受け付けていません

Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis

要約 組織病理学的全スライド画像 (WSI) の分類は、医療顕微鏡画像処理の基礎 … 続きを読む

カテゴリー: cs.CV | Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis はコメントを受け付けていません

Multi-modal Auto-regressive Modeling via Visual Words

要約 大規模言語モデル (LLM) は、注釈のない大量のテキスト コーパスに対し … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-modal Auto-regressive Modeling via Visual Words はコメントを受け付けていません