月別アーカイブ: 2024年4月

Rolling Shutter Correction with Intermediate Distortion Flow Estimation

要約 本稿では、グローバルシャッター(GS)からRSへの歪みの流れを直接推定する … 続きを読む

カテゴリー: cs.CV | Rolling Shutter Correction with Intermediate Distortion Flow Estimation はコメントを受け付けていません

HPNet: Dynamic Trajectory Forecasting with Historical Prediction Attention

要約 道路管理者の軌道を予測することは、自動運転システムにとって不可欠です。 最 … 続きを読む

カテゴリー: cs.CV | HPNet: Dynamic Trajectory Forecasting with Historical Prediction Attention はコメントを受け付けていません

DaF-BEVSeg: Distortion-aware Fisheye Camera based Bird’s Eye View Segmentation with Occlusion Reasoning

要約 セマンティック セグメンテーションは、シーンの理解を実行する効果的な方法で … 続きを読む

カテゴリー: cs.CV, cs.RO | DaF-BEVSeg: Distortion-aware Fisheye Camera based Bird’s Eye View Segmentation with Occlusion Reasoning はコメントを受け付けていません

High Noise Scheduling is a Must

要約 一貫性モデルは画像生成のための高い機能を備えており、高度な技術によりサンプ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | High Noise Scheduling is a Must はコメントを受け付けていません

Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation

要約 Segment Anything Model (SAM) と CLIP は … 続きを読む

カテゴリー: cs.AI, cs.CV | Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation はコメントを受け付けていません

Dynamic Resolution Guidance for Facial Expression Recognition

要約 顔の表情認識 (FER) は、人間とコンピューターのインタラクションや感情 … 続きを読む

カテゴリー: cs.CV, cs.MM | Dynamic Resolution Guidance for Facial Expression Recognition はコメントを受け付けていません

VISION2UI: A Real-World Dataset with Layout for Code Generation from UI Designs

要約 Web ページのデザイン ビジョンから UI コードを自動的に生成すると、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SE | VISION2UI: A Real-World Dataset with Layout for Code Generation from UI Designs はコメントを受け付けていません

MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization

要約 効率的なネットワークの混合精度量子化では、ビット選択の探索中に発生する活性 … 続きを読む

カテゴリー: cs.CV, cs.LG | MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization はコメントを受け付けていません

CN-RMA: Combined Network with Ray Marching Aggregation for 3D Indoors Object Detection from Multi-view Images

要約 この論文では、多視点画像からの 3D 屋内物体検出のための新しいアプローチ … 続きを読む

カテゴリー: cs.CV | CN-RMA: Combined Network with Ray Marching Aggregation for 3D Indoors Object Detection from Multi-view Images はコメントを受け付けていません

Are We on the Right Way for Evaluating Large Vision-Language Models?

要約 Large Vision-Language Model (LVLM) は最 … 続きを読む

カテゴリー: cs.CV | Are We on the Right Way for Evaluating Large Vision-Language Models? はコメントを受け付けていません