月別アーカイブ: 2024年8月

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

投稿日: 2024年8月8日作成者: jarxiv

要約単眼の 3D 物体検出は自動運転において重要な役割を果たします。ただし、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Global-Local Progressive Integration Network for Blind Image Quality Assessment

投稿日: 2024年8月8日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、長期的な依存関係をモデル化す … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

投稿日: 2024年8月8日作成者: jarxiv

要約生徒と教師のネットワークに基づく知識の蒸留は、困難な教師なし異常検出タスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

投稿日: 2024年8月8日作成者: jarxiv

要約生成モデルの急速な発展により、人工知能生成コンテンツ (AIGC) が日常 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

投稿日: 2024年8月8日作成者: jarxiv

要約車両軌道予測はデータ駆動型ソリューションへの依存度が高まっていますが、さま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ESP-MedSAM: Efficient Self-Prompting SAM for Universal Image Segmentation

投稿日: 2024年8月8日作成者: jarxiv

要約 Segment Anything Model (SAM) は、医療画像のセ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Lightweight Video Denoising Using a Classic Bayesian Backbone

投稿日: 2024年8月8日作成者: jarxiv

要約近年、最先端の画像およびビデオのノイズ除去ネットワークはますます大規模化し … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | コメントを受け付けていません

AdapMTL: Adaptive Pruning Framework for Multitask Learning Model

投稿日: 2024年8月8日作成者: jarxiv

要約マルチメディアおよびマルチモーダル処理の領域では、画像、ビデオ、センサー … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

FMiFood: Multi-modal Contrastive Learning for Food Image Classification

投稿日: 2024年8月8日作成者: jarxiv

要約食品画像の分類は、画像ベースの食事評価の基本的なステップであり、食事の機会 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining

投稿日: 2024年8月8日作成者: jarxiv

要約画像ディレインは、雨の画像から雨の縞模様を除去し、鮮明な背景を復元すること … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

月別アーカイブ: 2024年8月

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

Global-Local Progressive Integration Network for Blind Image Quality Assessment

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

ESP-MedSAM: Efficient Self-Prompting SAM for Universal Image Segmentation

Lightweight Video Denoising Using a Classic Bayesian Backbone

AdapMTL: Adaptive Pruning Framework for Multitask Learning Model

FMiFood: Multi-modal Contrastive Learning for Food Image Classification

FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining

最近の投稿

最近のコメント

アーカイブ

カテゴリー