投稿者「jarxiv」のアーカイブ

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

投稿日: 2025年5月15日作成者: jarxiv

要約最先端の空間的アクション検出（STAD）メソッドは、放送ビデオからサッカー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A 2D Semantic-Aware Position Encoding for Vision Transformers

投稿日: 2025年5月15日作成者: jarxiv

要約ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

投稿日: 2025年5月15日作成者: jarxiv

要約フェイスアンチスポーフィング（FAS）は、支払い処理や監視などの多様なシナ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

投稿日: 2025年5月15日作成者: jarxiv

要約このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

投稿日: 2025年5月15日作成者: jarxiv

要約眼窩周囲距離は、さまざまな眼形成および頭蓋顔面の状態を診断および監視するた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Call to Arms: AI Should be Critical for Social Media Analysis of Conflict Zones

投稿日: 2025年5月15日作成者: jarxiv

要約ソーシャルメディアデータの大幅な拡散は、紛争研究と武器の使用を追跡するため … 続きを読む →

カテゴリー: cs.CV, cs.CY, cs.HC | コメントを受け付けていません

Spec2VolCAMU-Net: A Spectrogram-to-Volume Model for EEG-to-fMRI Reconstruction based on Multi-directional Time-Frequency Convolutional Attention Encoder and Vision-Mamba U-Net

投稿日: 2025年5月15日作成者: jarxiv

要約高解像度の機能的磁気共鳴イメージング（fMRI）は、人間の脳活動をマッピン … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Conformal Bounds on Full-Reference Image Quality for Imaging Inverse Problems

投稿日: 2025年5月15日作成者: jarxiv

要約イメージングの逆の問題では、回復した画像がPSNR、SSIM、LPIPSな … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Contactless Cardiac Pulse Monitoring Using Event Cameras

投稿日: 2025年5月15日作成者: jarxiv

要約タイムイベントカメラは、非常に低いレイテンシでシーン情報を記録するための新 … 続きを読む →

カテゴリー: cs.CV, cs.ET, cs.LG, eess.IV | コメントを受け付けていません

Camera-Only 3D Panoptic Scene Completion for Autonomous Driving through Differentiable Object Shapes

投稿日: 2025年5月15日作成者: jarxiv

要約自動運転車には、計画と行動のために周囲の完全な地図が必要です。これにより … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

A 2D Semantic-Aware Position Encoding for Vision Transformers

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

A Call to Arms: AI Should be Critical for Social Media Analysis of Conflict Zones

Spec2VolCAMU-Net: A Spectrogram-to-Volume Model for EEG-to-fMRI Reconstruction based on Multi-directional Time-Frequency Convolutional Attention Encoder and Vision-Mamba U-Net

Conformal Bounds on Full-Reference Image Quality for Imaging Inverse Problems

Contactless Cardiac Pulse Monitoring Using Event Cameras

Camera-Only 3D Panoptic Scene Completion for Autonomous Driving through Differentiable Object Shapes

最近の投稿

最近のコメント

アーカイブ

カテゴリー