月別アーカイブ: 2024年8月

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

要約 単眼の 3D 物体検出は自動運転において重要な役割を果たします。 ただし、 … 続きを読む

カテゴリー: cs.CV | Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training はコメントを受け付けていません

Global-Local Progressive Integration Network for Blind Image Quality Assessment

要約 ビジョン トランスフォーマー (ViT) は、長期的な依存関係をモデル化す … 続きを読む

カテゴリー: cs.CV, eess.IV | Global-Local Progressive Integration Network for Blind Image Quality Assessment はコメントを受け付けていません

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

要約 生徒と教師のネットワークに基づく知識の蒸留は、困難な教師なし異常検出タスク … 続きを読む

カテゴリー: cs.CV | Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection はコメントを受け付けていません

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

要約 生成モデルの急速な発展により、人工知能生成コンテンツ (AIGC) が日常 … 続きを読む

カテゴリー: cs.CV | Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment はコメントを受け付けていません

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

要約 車両軌道予測はデータ駆動型ソリューションへの依存度が高まっていますが、さま … 続きを読む

カテゴリー: cs.CV | UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction はコメントを受け付けていません

ESP-MedSAM: Efficient Self-Prompting SAM for Universal Image Segmentation

要約 Segment Anything Model (SAM) は、医療画像のセ … 続きを読む

カテゴリー: cs.CV, eess.IV | ESP-MedSAM: Efficient Self-Prompting SAM for Universal Image Segmentation はコメントを受け付けていません

Lightweight Video Denoising Using a Classic Bayesian Backbone

要約 近年、最先端の画像およびビデオのノイズ除去ネットワークはますます大規模化し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | Lightweight Video Denoising Using a Classic Bayesian Backbone はコメントを受け付けていません

AdapMTL: Adaptive Pruning Framework for Multitask Learning Model

要約 マルチメディアおよびマルチモーダル処理の領域では、画像、ビデオ、センサー … 続きを読む

カテゴリー: cs.CV, cs.LG | AdapMTL: Adaptive Pruning Framework for Multitask Learning Model はコメントを受け付けていません

FMiFood: Multi-modal Contrastive Learning for Food Image Classification

要約 食品画像の分類は、画像ベースの食事評価の基本的なステップであり、食事の機会 … 続きを読む

カテゴリー: cs.CV | FMiFood: Multi-modal Contrastive Learning for Food Image Classification はコメントを受け付けていません

FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining

要約 画像ディレインは、雨の画像から雨の縞模様を除去し、鮮明な背景を復元すること … 続きを読む

カテゴリー: cs.CV, eess.IV | FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining はコメントを受け付けていません