cs.CV」カテゴリーアーカイブ

Adapted-MoE: Mixture of Experts with Test-Time Adaption for Anomaly Detection

要約 異常を区別するための正常なサンプルの表現に基づく教師なし異常検出方法のほと … 続きを読む

カテゴリー: cs.AI, cs.CV | Adapted-MoE: Mixture of Experts with Test-Time Adaption for Anomaly Detection はコメントを受け付けていません

Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery

要約 衛星画像は、その長距離撮像により、微小物体の検出など、スケールに適したさま … 続きを読む

カテゴリー: cs.CV | Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery はコメントを受け付けていません

3D-SAR Tomography and Machine Learning for High-Resolution Tree Height Estimation

要約 森林バイオマスを正確に推定することは、地球規模の炭素循環モデリングと気候変 … 続きを読む

カテゴリー: cs.AI, cs.CV | 3D-SAR Tomography and Machine Learning for High-Resolution Tree Height Estimation はコメントを受け付けていません

Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification

要約 可視赤外線による人物の再識別における主な課題は、モード間およびモード内の変 … 続きを読む

カテゴリー: cs.CV | Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification はコメントを受け付けていません

Replay Consolidation with Label Propagation for Continual Object Detection

要約 物体検出は、ロボット工学や自動運転などの多くのアプリケーションに関連性の高 … 続きを読む

カテゴリー: cs.AI, cs.CV | Replay Consolidation with Label Propagation for Continual Object Detection はコメントを受け付けていません

CLFT: Camera-LiDAR Fusion Transformer for Semantic Segmentation in Autonomous Driving

要約 自動運転のためのカメラと LiDAR ベースのセマンティック オブジェクト … 続きを読む

カテゴリー: cs.CV, cs.RO | CLFT: Camera-LiDAR Fusion Transformer for Semantic Segmentation in Autonomous Driving はコメントを受け付けていません

Real-Time Human Action Recognition on Embedded Platforms

要約 コンピュータービジョンとディープラーニングの進歩により、ビデオベースの人間 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Real-Time Human Action Recognition on Embedded Platforms はコメントを受け付けていません

Robust Real-time Segmentation of Bio-Morphological Features in Human Cherenkov Imaging during Radiotherapy via Deep Learning

要約 チェレンコフ イメージングにより、放射線治療 (RT) 中に患者に照射され … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Robust Real-time Segmentation of Bio-Morphological Features in Human Cherenkov Imaging during Radiotherapy via Deep Learning はコメントを受け付けていません

FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo Embeddings

要約 ロゴ埋め込みモデルは、画像内の製品ロゴをベクトルに変換し、電子商取引プラッ … 続きを読む

カテゴリー: cs.CV | FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo Embeddings はコメントを受け付けていません

TextGaze: Gaze-Controllable Face Generation with Natural Language

要約 特定の視線情報を利用した顔画像の生成が注目を集めています。 既存のアプロー … 続きを読む

カテゴリー: cs.CV | TextGaze: Gaze-Controllable Face Generation with Natural Language はコメントを受け付けていません