cs.CV」カテゴリーアーカイブ

Segmentation by Factorization: Unsupervised Semantic Segmentation for Pathology by Factorizing Foundation Model Features

要約 因数分解によるセグメンテーション (F-SEG) を紹介します。これは、事 … 続きを読む

カテゴリー: cs.CV, cs.LG | Segmentation by Factorization: Unsupervised Semantic Segmentation for Pathology by Factorizing Foundation Model Features はコメントを受け付けていません

Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling

要約 手書き認識システムの主な課題は、長距離のコンテキスト依存関係を管理すること … 続きを読む

カテゴリー: cs.CV | Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling はコメントを受け付けていません

Referring Expression Generation in Visually Grounded Dialogue with Discourse-aware Comprehension Guiding

要約 我々は、差別的かつ談話に適した指示表現(RE)を生成することを目的とした、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Referring Expression Generation in Visually Grounded Dialogue with Discourse-aware Comprehension Guiding はコメントを受け付けていません

The Influence of Faulty Labels in Data Sets on Human Pose Estimation

要約 この研究では、トレーニング データの品質が人間姿勢推定 (HPE) におけ … 続きを読む

カテゴリー: cs.CV, cs.LG | The Influence of Faulty Labels in Data Sets on Human Pose Estimation はコメントを受け付けていません

Robust Loss Functions for Object Grasping under Limited Ground Truth

要約 物体把握は、ロボットが環境を認識し、環境と十分に対話できるようにする重要な … 続きを読む

カテゴリー: cs.CV, cs.RO | Robust Loss Functions for Object Grasping under Limited Ground Truth はコメントを受け付けていません

X-InstructBLIP: A Framework for aligning X-Modal instruction-aware representations to LLMs and Emergent Cross-modal Reasoning

要約 最近の研究では、画像から言語への投影を学習し、大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.CV | X-InstructBLIP: A Framework for aligning X-Modal instruction-aware representations to LLMs and Emergent Cross-modal Reasoning はコメントを受け付けていません

ReL-SAR: Representation Learning for Skeleton Action Recognition with Convolutional Transformers and BYOL

要約 堅牢で一般化可能なスケルトン アクション認識特徴を抽出するには、通常、十分 … 続きを読む

カテゴリー: cs.AI, cs.CV | ReL-SAR: Representation Learning for Skeleton Action Recognition with Convolutional Transformers and BYOL はコメントを受け付けていません

TivNe-SLAM: Dynamic Mapping and Tracking via Time-Varying Neural Radiance Fields

要約 Neural Radiance Fields (NeRF) を Simul … 続きを読む

カテゴリー: cs.CV | TivNe-SLAM: Dynamic Mapping and Tracking via Time-Varying Neural Radiance Fields はコメントを受け付けていません

Long-term Pre-training for Temporal Action Detection with Transformers

要約 時間的動作検出 (TAD) は困難ですが、現実世界のビデオ アプリケーショ … 続きを読む

カテゴリー: cs.CV | Long-term Pre-training for Temporal Action Detection with Transformers はコメントを受け付けていません

3D Lymphoma Segmentation on PET/CT Images via Multi-Scale Information Fusion with Cross-Attention

要約 背景: びまん性大細胞型 B 細胞リンパ腫 (DLBCL) 病変の正確なセ … 続きを読む

カテゴリー: cs.CV, eess.IV | 3D Lymphoma Segmentation on PET/CT Images via Multi-Scale Information Fusion with Cross-Attention はコメントを受け付けていません