月別アーカイブ: 2024年3月

SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams

要約 ぼやけた入力から一連の鮮明な画像を再構成することは、キャプチャされたシーン … 続きを読む

カテゴリー: cs.CV | SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams はコメントを受け付けていません

Anomaly Detection by Adapting a pre-trained Vision Language Model

要約 最近、大規模なビジョンおよび言語モデルが、多くの下流タスクに適応した場合に … 続きを読む

カテゴリー: cs.CV | Anomaly Detection by Adapting a pre-trained Vision Language Model はコメントを受け付けていません

Plug and Play Active Learning for Object Detection

要約 物体検出のためにデータセットにアノテーションを付けるのは、費用と時間のかか … 続きを読む

カテゴリー: cs.CV, cs.LG | Plug and Play Active Learning for Object Detection はコメントを受け付けていません

AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation

要約 半教師ありセマンティック セグメンテーション (SSSS) は、大量のラベ … 続きを読む

カテゴリー: cs.AI, cs.CV | AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation はコメントを受け付けていません

A Comprehensive Dataset and Automated Pipeline for Nailfold Capillary Analysis

要約 爪折り毛細管鏡検査は健康状態の評価に広く使用されており、自動爪折り毛細管分 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A Comprehensive Dataset and Automated Pipeline for Nailfold Capillary Analysis はコメントを受け付けていません

Faceptor: A Generalist Model for Face Perception

要約 さまざまな顔分析タスクについて包括的な研究が実施されるにつれ、顔認識に対す … 続きを読む

カテゴリー: cs.CV | Faceptor: A Generalist Model for Face Perception はコメントを受け付けていません

DiffSF: Diffusion Models for Scene Flow Estimation

要約 シーン フロー推定は、現実世界のさまざまなアプリケーション、特に自動運転車 … 続きを読む

カテゴリー: cs.CV | DiffSF: Diffusion Models for Scene Flow Estimation はコメントを受け付けていません

Osprey: Pixel Understanding with Visual Instruction Tuning

要約 マルチモーダル大規模言語モデル (MLLM) は最近、視覚的な命令のチュー … 続きを読む

カテゴリー: cs.CV | Osprey: Pixel Understanding with Visual Instruction Tuning はコメントを受け付けていません

Don’t Judge by the Look: A Motion Coherent Augmentation for Video Recognition

要約 物体認識における現在のトレーニング パイプラインでは、分類に有害な外観の変 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Don’t Judge by the Look: A Motion Coherent Augmentation for Video Recognition はコメントを受け付けていません

SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition

要約 スケルトンベースの動作認識は、スケルトンデータ内の関節の座標と接続性に基づ … 続きを読む

カテゴリー: cs.CV | SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition はコメントを受け付けていません