月別アーカイブ: 2024年4月

Rolling Shutter Correction with Intermediate Distortion Flow Estimation

投稿日: 2024年4月10日作成者: jarxiv

要約本稿では、グローバルシャッター(GS)からRSへの歪みの流れを直接推定する … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HPNet: Dynamic Trajectory Forecasting with Historical Prediction Attention

投稿日: 2024年4月10日作成者: jarxiv

要約道路管理者の軌道を予測することは、自動運転システムにとって不可欠です。最 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DaF-BEVSeg: Distortion-aware Fisheye Camera based Bird’s Eye View Segmentation with Occlusion Reasoning

投稿日: 2024年4月10日作成者: jarxiv

要約セマンティックセグメンテーションは、シーンの理解を実行する効果的な方法で … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

High Noise Scheduling is a Must

投稿日: 2024年4月10日作成者: jarxiv

要約一貫性モデルは画像生成のための高い機能を備えており、高度な技術によりサンプ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

投稿日: 2024年4月10日作成者: jarxiv

要約 Segment Anything Model (SAM) と CLIP は … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Dynamic Resolution Guidance for Facial Expression Recognition

投稿日: 2024年4月10日作成者: jarxiv

要約顔の表情認識 (FER) は、人間とコンピューターのインタラクションや感情 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

VISION2UI: A Real-World Dataset with Layout for Code Generation from UI Designs

投稿日: 2024年4月10日作成者: jarxiv

要約 Web ページのデザインビジョンから UI コードを自動的に生成すると、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.SE | コメントを受け付けていません

MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization

投稿日: 2024年4月10日作成者: jarxiv

要約効率的なネットワークの混合精度量子化では、ビット選択の探索中に発生する活性 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CN-RMA: Combined Network with Ray Marching Aggregation for 3D Indoors Object Detection from Multi-view Images

投稿日: 2024年4月10日作成者: jarxiv

要約この論文では、多視点画像からの 3D 屋内物体検出のための新しいアプローチ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Are We on the Right Way for Evaluating Large Vision-Language Models?

投稿日: 2024年4月10日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は最 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年4月

Rolling Shutter Correction with Intermediate Distortion Flow Estimation

HPNet: Dynamic Trajectory Forecasting with Historical Prediction Attention

DaF-BEVSeg: Distortion-aware Fisheye Camera based Bird’s Eye View Segmentation with Occlusion Reasoning

High Noise Scheduling is a Must

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

Dynamic Resolution Guidance for Facial Expression Recognition

VISION2UI: A Real-World Dataset with Layout for Code Generation from UI Designs

MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization

CN-RMA: Combined Network with Ray Marching Aggregation for 3D Indoors Object Detection from Multi-view Images

Are We on the Right Way for Evaluating Large Vision-Language Models?

最近の投稿

最近のコメント

アーカイブ

カテゴリー