投稿者「jarxiv」のアーカイブ

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

要約 最先端の空間的アクション検出(STAD)メソッドは、放送ビデオからサッカー … 続きを読む

カテゴリー: cs.CV | Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos はコメントを受け付けていません

A 2D Semantic-Aware Position Encoding for Vision Transformers

要約 ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む

カテゴリー: cs.AI, cs.CV | A 2D Semantic-Aware Position Encoding for Vision Transformers はコメントを受け付けていません

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

要約 フェイスアンチスポーフィング(FAS)は、支払い処理や監視などの多様なシナ … 続きを読む

カテゴリー: cs.CV | Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing はコメントを受け付けていません

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

要約 このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CV | Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput はコメントを受け付けていません

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

要約 眼窩周囲距離は、さまざまな眼形成および頭蓋顔面の状態を診断および監視するた … 続きを読む

カテゴリー: cs.AI, cs.CV | State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features はコメントを受け付けていません

A Call to Arms: AI Should be Critical for Social Media Analysis of Conflict Zones

要約 ソーシャルメディアデータの大幅な拡散は、紛争研究と武器の使用を追跡するため … 続きを読む

カテゴリー: cs.CV, cs.CY, cs.HC | A Call to Arms: AI Should be Critical for Social Media Analysis of Conflict Zones はコメントを受け付けていません

Spec2VolCAMU-Net: A Spectrogram-to-Volume Model for EEG-to-fMRI Reconstruction based on Multi-directional Time-Frequency Convolutional Attention Encoder and Vision-Mamba U-Net

要約 高解像度の機能的磁気共鳴イメージング(fMRI)は、人間の脳活動をマッピン … 続きを読む

カテゴリー: cs.CV, eess.IV | Spec2VolCAMU-Net: A Spectrogram-to-Volume Model for EEG-to-fMRI Reconstruction based on Multi-directional Time-Frequency Convolutional Attention Encoder and Vision-Mamba U-Net はコメントを受け付けていません

Conformal Bounds on Full-Reference Image Quality for Imaging Inverse Problems

要約 イメージングの逆の問題では、回復した画像がPSNR、SSIM、LPIPSな … 続きを読む

カテゴリー: cs.CV | Conformal Bounds on Full-Reference Image Quality for Imaging Inverse Problems はコメントを受け付けていません

Contactless Cardiac Pulse Monitoring Using Event Cameras

要約 タイムイベントカメラは、非常に低いレイテンシでシーン情報を記録するための新 … 続きを読む

カテゴリー: cs.CV, cs.ET, cs.LG, eess.IV | Contactless Cardiac Pulse Monitoring Using Event Cameras はコメントを受け付けていません

Camera-Only 3D Panoptic Scene Completion for Autonomous Driving through Differentiable Object Shapes

要約 自動運転車には、計画と行動のために周囲の完全な地図が必要です。 これにより … 続きを読む

カテゴリー: cs.CV | Camera-Only 3D Panoptic Scene Completion for Autonomous Driving through Differentiable Object Shapes はコメントを受け付けていません