-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
MoRAL: Motion-aware Multi-Frame 4D Radar and LiDAR Fusion for Robust 3D Object Detection
要約 信頼性の高い自律駆動システムには、交通参加者の正確な検出が必要です。 この … 続きを読む
カテゴリー: cs.CV
MoRAL: Motion-aware Multi-Frame 4D Radar and LiDAR Fusion for Robust 3D Object Detection はコメントを受け付けていません
F$^3$Loc: Fusion and Filtering for Floorplan Localization
要約 この論文では、フロアプラン内の自己局在化に対する効率的なデータ駆動型ソリュ … 続きを読む
Efficient LiDAR Reflectance Compression via Scanning Serialization
要約 Lidar Point Cloudsの反射属性は、下流のタスクに不可欠な情 … 続きを読む
Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records
要約 画像テキストの大腸内視鏡検査記録の事前トレーニングは、内視鏡画像分析を改善 … 続きを読む
HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment
要約 メッシュ品質評価(MQA)モデルは、さまざまなアプリケーションでのメッシュ … 続きを読む
MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy
要約 超音波誘導性細い針吸引(FNA)生検は、一般的な低侵襲診断手順です。 ただ … 続きを読む
カテゴリー: cs.CV
MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy はコメントを受け付けていません
Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos
要約 最先端の空間的アクション検出(STAD)メソッドは、放送ビデオからサッカー … 続きを読む
カテゴリー: cs.CV
Beyond Pixels: Leveraging the Language of Soccer to Improve Spatio-Temporal Action Detection in Broadcast Videos はコメントを受け付けていません
A 2D Semantic-Aware Position Encoding for Vision Transformers
要約 ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む
Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing
要約 フェイスアンチスポーフィング(FAS)は、支払い処理や監視などの多様なシナ … 続きを読む
カテゴリー: cs.CV
Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing はコメントを受け付けていません
Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput
要約 このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む