月別アーカイブ: 2025年5月

F$^3$Loc: Fusion and Filtering for Floorplan Localization

要約 この論文では、フロアプラン内の自己局在化に対する効率的なデータ駆動型ソリュ … 続きを読む

カテゴリー: cs.CV, cs.RO | F$^3$Loc: Fusion and Filtering for Floorplan Localization はコメントを受け付けていません

Efficient LiDAR Reflectance Compression via Scanning Serialization

要約 Lidar Point Cloudsの反射属性は、下流のタスクに不可欠な情 … 続きを読む

カテゴリー: cs.CV, eess.IV | Efficient LiDAR Reflectance Compression via Scanning Serialization はコメントを受け付けていません

Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records

要約 画像テキストの大腸内視鏡検査記録の事前トレーニングは、内視鏡画像分析を改善 … 続きを読む

カテゴリー: cs.AI, cs.CV | Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records はコメントを受け付けていません

HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment

要約 メッシュ品質評価(MQA)モデルは、さまざまなアプリケーションでのメッシュ … 続きを読む

カテゴリー: cs.CV, cs.MM | HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment はコメントを受け付けていません

MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy

要約 超音波誘導性細い針吸引(FNA)生検は、一般的な低侵襲診断手順です。 ただ … 続きを読む

カテゴリー: cs.CV | MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy はコメントを受け付けていません

Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos

要約 最先端の空間的アクション検出(STAD)メソッドは、放送ビデオからサッカー … 続きを読む

カテゴリー: cs.CV | Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos はコメントを受け付けていません

A 2D Semantic-Aware Position Encoding for Vision Transformers

要約 ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む

カテゴリー: cs.AI, cs.CV | A 2D Semantic-Aware Position Encoding for Vision Transformers はコメントを受け付けていません

Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing

要約 フェイスアンチスポーフィング(FAS)は、支払い処理や監視などの多様なシナ … 続きを読む

カテゴリー: cs.CV | Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing はコメントを受け付けていません

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

要約 このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CV | Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput はコメントを受け付けていません

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

要約 眼窩周囲距離は、さまざまな眼形成および頭蓋顔面の状態を診断および監視するた … 続きを読む

カテゴリー: cs.AI, cs.CV | State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features はコメントを受け付けていません