月別アーカイブ: 2024年3月

Zero-Shot Aerial Object Detection with Visual Description Regularization

要約 既存の物体検出モデルは、主に大規模なラベル付きデータセットを用いて学習され … 続きを読む

カテゴリー: cs.CV | Zero-Shot Aerial Object Detection with Visual Description Regularization はコメントを受け付けていません

SegReg: Segmenting OARs by Registering MR Images and CT Annotations

要約 OAR(Organ at Risk)セグメンテーションは、頭頸部腫瘍などの … 続きを読む

カテゴリー: cs.CV | SegReg: Segmenting OARs by Registering MR Images and CT Annotations はコメントを受け付けていません

Out-of-Distribution Detection using Neural Activation Prior

要約 分布外検出は、機械学習モデルを実世界に導入し、未知のシナリオに対応するため … 続きを読む

カテゴリー: cs.CV | Out-of-Distribution Detection using Neural Activation Prior はコメントを受け付けていません

EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE

要約 多様なマルチモーダルデータから学習するスケーラブルな視覚言語モデルの構築は … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM | EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE はコメントを受け付けていません

DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder

要約 最近の研究により、音声駆動型話し顔生成は大きく進歩したが、生成された映像の … 続きを読む

カテゴリー: cs.CV, cs.MM | DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder はコメントを受け付けていません

Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial Detection

要約 畳み込みニューラルネットワーク(CNN)は、多くの知覚タスクにおいて最先端 … 続きを読む

カテゴリー: cs.CR, cs.CV | Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial Detection はコメントを受け付けていません

High-Speed Detector For Low-Powered Devices In Aerial Grasping

要約 自律的な空中収穫は、非常に複雑な問題である。というのも、小型の低電力コンピ … 続きを読む

カテゴリー: cs.CV, cs.RO | High-Speed Detector For Low-Powered Devices In Aerial Grasping はコメントを受け付けていません

Adversarial Examples are Misaligned in Diffusion Model Manifolds

要約 近年、拡散モデル(Diffusion Model: DM)は、データ分布の … 続きを読む

カテゴリー: cs.CR, cs.CV | Adversarial Examples are Misaligned in Diffusion Model Manifolds はコメントを受け付けていません

GAMMA: Generalizable Articulation Modeling and Manipulation for Articulated Objects

要約 キャビネットやドアのような多関節オブジェクトは、日常生活に広く普及している … 続きを読む

カテゴリー: cs.CV, cs.RO | GAMMA: Generalizable Articulation Modeling and Manipulation for Articulated Objects はコメントを受け付けていません

BenchCloudVision: A Benchmark Analysis of Deep Learning Approaches for Cloud Detection and Segmentation in Remote Sensing Imagery

要約 光学センサーを搭載した人工衛星は高解像度の画像を取得し、様々な環境現象に対 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | BenchCloudVision: A Benchmark Analysis of Deep Learning Approaches for Cloud Detection and Segmentation in Remote Sensing Imagery はコメントを受け付けていません