月別アーカイブ: 2024年6月

Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers

要約 堅牢性を向上させるための敵対的トレーニング戦略に関する広範な研究にもかかわ … 続きを読む

Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference

要約 人間は、単一のクエリと参照画像のペアだけが与えられれば、ラベルやトレーニン … 続きを読む

DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance

要約 最近の大規模生成モデルの急増により、コンピューター ビジョンの広大な分野の … 続きを読む

GaussianDreamerPro: Text to Manipulable 3D Gaussians with Highly Enhanced Quality

要約 最近、3D ガウス スプラッティング (3D-GS) は、現実世界のシーン … 続きを読む

Unsupervised Open-Vocabulary Object Localization in Videos

要約 この論文では、ビデオ表現学習と事前トレーニングされた視覚言語モデルの最近の … 続きを読む

Robust Surgical Phase Recognition From Annotation Efficient Supervision

要約 手術段階認識は、コンピューター支援手術における重要なタスクであり、手術手順 … 続きを読む

Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration

要約 深層学習ベースの画像復元手法は大幅な進歩を遂げていますが、合成データでのト … 続きを読む

CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs

要約 科学論文や財務レポートの分析など、現実世界のタスクにマルチモーダル大規模言 … 続きを読む

ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation

要約 私たちは、タイムラプスビデオ生成における T2V モデル (Sora や … 続きを読む

MultiDiff: Consistent Novel View Synthesis from a Single Image

要約 単一の RGB 画像からシーンを一貫して新しいビュー合成するための新しいア … 続きを読む

