「cs.CV」カテゴリーアーカイブ

MoRAL: Motion-aware Multi-Frame 4D Radar and LiDAR Fusion for Robust 3D Object Detection

投稿日: 2025年5月15日作成者: jarxiv

要約信頼性の高い自律駆動システムには、交通参加者の正確な検出が必要です。この … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

F$^3$Loc: Fusion and Filtering for Floorplan Localization

投稿日: 2025年5月15日作成者: jarxiv

要約この論文では、フロアプラン内の自己局在化に対する効率的なデータ駆動型ソリュ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Efficient LiDAR Reflectance Compression via Scanning Serialization

投稿日: 2025年5月15日作成者: jarxiv

要約 Lidar Point Cloudsの反射属性は、下流のタスクに不可欠な情 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records

投稿日: 2025年5月15日作成者: jarxiv

要約画像テキストの大腸内視鏡検査記録の事前トレーニングは、内視鏡画像分析を改善 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment

投稿日: 2025年5月15日作成者: jarxiv

要約メッシュ品質評価（MQA）モデルは、さまざまなアプリケーションでのメッシュ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy

投稿日: 2025年5月15日作成者: jarxiv

要約超音波誘導性細い針吸引（FNA）生検は、一般的な低侵襲診断手順です。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

投稿日: 2025年5月15日作成者: jarxiv

要約最先端の空間的アクション検出（STAD）メソッドは、放送ビデオからサッカー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A 2D Semantic-Aware Position Encoding for Vision Transformers

投稿日: 2025年5月15日作成者: jarxiv

要約ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

投稿日: 2025年5月15日作成者: jarxiv

要約フェイスアンチスポーフィング（FAS）は、支払い処理や監視などの多様なシナ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

投稿日: 2025年5月15日作成者: jarxiv

要約このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

MoRAL: Motion-aware Multi-Frame 4D Radar and LiDAR Fusion for Robust 3D Object Detection

F$^3$Loc: Fusion and Filtering for Floorplan Localization

Efficient LiDAR Reflectance Compression via Scanning Serialization

Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records

HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment

MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

A 2D Semantic-Aware Position Encoding for Vision Transformers

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

最近の投稿

最近のコメント

アーカイブ

カテゴリー