cs.CV」カテゴリーアーカイブ

Distilling foundation models for robust and efficient models in digital pathology

要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.9 | コメントする

HQColon: A Hybrid Interactive Machine Learning Pipeline for High Quality Colon Labeling and Segmentation

要約 高解像度の結腸セグメンテーションは、デジタル双子や個別化医療などの臨床およ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Towards High-performance Spiking Transformers from ANN to SNN Conversion

要約 スパイクニューラルネットワーク(SNN)は、エネルギー効率、高速処理能力、 … 続きを読む

カテゴリー: cs.CV | コメントする

The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition

要約 カメラトラップビデオ映像のコンピュータービジョン分析は、キャプチャされた行 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

ReMatching Dynamic Reconstruction Flow

要約 画像入力から動的シーンを再構築することは、多くのダウンストリームアプリケー … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | コメントする

Towards long-term player tracking with graph hierarchies and domain-specific features

要約 チームスポーツ分析では、プレーヤーの外観の類似性、閉塞、および動的モーショ … 続きを読む

カテゴリー: cs.CV | コメントする

Anatomically-guided masked autoencoder pre-training for aneurysm detection

要約 頭蓋内動脈瘤は、世界中の罹患率と死亡率の主な原因であり、それらを手動で検出 … 続きを読む

カテゴリー: cs.CV | コメントする

AeroReformer: Aerial Referring Transformer for UAV-based Referring Image Segmentation

要約 斬新で挑戦的なタスクとして、セグメンテーションを参照することで、コンピュー … 続きを読む

カテゴリー: cs.CV | コメントする

Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ?

要約 二重の思考フレームワークは、高速で直感的で、論理処理が遅くなることを考慮し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩は、さまざまなマルチモ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする