月別アーカイブ: 2024年4月

Benchmarking the Fairness of Image Upsampling Methods

要約 近年、画像やビデオなどの合成メディアを作成するための深層生成モデルが急速に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Benchmarking the Fairness of Image Upsampling Methods はコメントを受け付けていません

On the Road to Clarity: Exploring Explainable AI for World Models in a Driver Assistance System

要約 自動運転(AD)では、間違いは高くつくため、透明性と安全性が最も重要です。 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MA | On the Road to Clarity: Exploring Explainable AI for World Models in a Driver Assistance System はコメントを受け付けていません

SEGSRNet for Stereo-Endoscopic Image Super-Resolution and Surgical Instrument Segmentation

要約 SEGSRNet は、医療画像処理やロボット手術でよくある問題である、低解 … 続きを読む

カテゴリー: cs.CV, eess.IV | SEGSRNet for Stereo-Endoscopic Image Super-Resolution and Surgical Instrument Segmentation はコメントを受け付けていません

Simultaneous Tri-Modal Medical Image Fusion and Super-Resolution using Conditional Diffusion Model

要約 臨床現場では、既存のデュアルモーダル技術と比較して、トリモーダル医用画像融 … 続きを読む

カテゴリー: cs.CV, eess.IV | Simultaneous Tri-Modal Medical Image Fusion and Super-Resolution using Conditional Diffusion Model はコメントを受け付けていません

UniRGB-IR: A Unified Framework for Visible-Infrared Downstream Tasks via Adapter Tuning

要約 可視(RGB)画像と赤外線(IR)画像のセマンティック分析は、低照度や複雑 … 続きを読む

カテゴリー: cs.CV | UniRGB-IR: A Unified Framework for Visible-Infrared Downstream Tasks via Adapter Tuning はコメントを受け付けていません

Gait Recognition in Large-scale Free Environment via Single LiDAR

要約 人間の歩行認識はマルチメディアにおいて極めて重要であり、直接的な対話を行わ … 続きを読む

カテゴリー: cs.CV | Gait Recognition in Large-scale Free Environment via Single LiDAR はコメントを受け付けていません

MV-VTON: Multi-View Virtual Try-On with Diffusion Models

要約 画像ベースのバーチャル試着の目的は、対象者が与えられた服を自然に着ているイ … 続きを読む

カテゴリー: cs.CV | MV-VTON: Multi-View Virtual Try-On with Diffusion Models はコメントを受け付けていません

Estimating the Robustness Radius for Randomized Smoothing with 100$\times$ Sample Efficiency

要約 ランダム化スムージング (RS) は、ランダム ノイズを追加して入力の複数 … 続きを読む

カテゴリー: cs.CV, cs.LG | Estimating the Robustness Radius for Randomized Smoothing with 100$\times$ Sample Efficiency はコメントを受け付けていません

Frequency-Guided Multi-Level Human Action Anomaly Detection with Normalizing Flows

要約 ヒューマン アクション異常検出 (HAAD) のタスクを紹介します。これは … 続きを読む

カテゴリー: cs.CV | Frequency-Guided Multi-Level Human Action Anomaly Detection with Normalizing Flows はコメントを受け付けていません

MEIA: Towards Realistic Multimodal Interaction and Manipulation for Embodied Robots

要約 大規模な言語モデルの開発の急増に伴い、身体化された知能への注目が高まってい … 続きを読む

カテゴリー: cs.CV | MEIA: Towards Realistic Multimodal Interaction and Manipulation for Embodied Robots はコメントを受け付けていません