月別アーカイブ: 2025年1月

Diversified Augmentation with Domain Adaptation for Debiased Video Temporal Grounding

要約 ビデオにおける時間的文のグラウンディング (TSGV) は、ターゲットの瞬 … 続きを読む

カテゴリー: cs.CV | Diversified Augmentation with Domain Adaptation for Debiased Video Temporal Grounding はコメントを受け付けていません

DM-Mamba: Dual-domain Multi-scale Mamba for MRI reconstruction

要約 加速された MRI 再構成は、k 空間での大幅なアンダーサンプリングにより … 続きを読む

カテゴリー: cs.CV, eess.IV | DM-Mamba: Dual-domain Multi-scale Mamba for MRI reconstruction はコメントを受け付けていません

ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection

要約 顔ランドマーク検出 (FLD) は大幅な進歩を遂げていますが、既存の FL … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection はコメントを受け付けていません

Revolutionizing Communication with Deep Learning and XAI for Enhanced Arabic Sign Language Recognition

要約 この研究では、MobileNetV3、ResNet50、Efficient … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | Revolutionizing Communication with Deep Learning and XAI for Enhanced Arabic Sign Language Recognition はコメントを受け付けていません

Benchmarking Multimodal Models for Fine-Grained Image Analysis: A Comparative Study Across Diverse Visual Features

要約 この記事では、画像の分析と解釈におけるマルチモーダル モデルの機能を評価す … 続きを読む

カテゴリー: cs.CV | Benchmarking Multimodal Models for Fine-Grained Image Analysis: A Comparative Study Across Diverse Visual Features はコメントを受け付けていません

Feedback-driven object detection and iterative model improvement

要約 自動物体検出は、さまざまなアプリケーションにわたってますます価値が高まって … 続きを読む

カテゴリー: cs.CV, cs.LG | Feedback-driven object detection and iterative model improvement はコメントを受け付けていません

Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models

要約 現在のガウス スプラッティング手法は、シーン全体を再構成するのには効果的で … 続きを読む

カテゴリー: cs.CV | Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models はコメントを受け付けていません

D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models

要約 拡散モデルは画像生成において最先端のパフォーマンスを実現しました。 ただし … 続きを読む

カテゴリー: cs.CV, cs.LG | D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models はコメントを受け付けていません

CG-MER: A Card Game-based Multimodal dataset for Emotion Recognition

要約 アフェクティブ コンピューティングの分野では、感情と新興テクノロジーの関係 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | CG-MER: A Card Game-based Multimodal dataset for Emotion Recognition はコメントを受け付けていません

A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation

要約 最近の基礎モデルにより、単眼の深さ推定において大きな進歩が可能になりました … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation はコメントを受け付けていません