-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
月別アーカイブ: 2024年6月
Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers
要約 堅牢性を向上させるための敵対的トレーニング戦略に関する広範な研究にもかかわ … 続きを読む
Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference
要約 人間は、単一のクエリと参照画像のペアだけが与えられれば、ラベルやトレーニン … 続きを読む
カテゴリー: cs.CV
Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference はコメントを受け付けていません
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance
要約 最近の大規模生成モデルの急増により、コンピューター ビジョンの広大な分野の … 続きを読む
カテゴリー: cs.CV
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance はコメントを受け付けていません
GaussianDreamerPro: Text to Manipulable 3D Gaussians with Highly Enhanced Quality
要約 最近、3D ガウス スプラッティング (3D-GS) は、現実世界のシーン … 続きを読む
Unsupervised Open-Vocabulary Object Localization in Videos
要約 この論文では、ビデオ表現学習と事前トレーニングされた視覚言語モデルの最近の … 続きを読む
カテゴリー: cs.CV
Unsupervised Open-Vocabulary Object Localization in Videos はコメントを受け付けていません
Robust Surgical Phase Recognition From Annotation Efficient Supervision
要約 手術段階認識は、コンピューター支援手術における重要なタスクであり、手術手順 … 続きを読む
カテゴリー: cs.CV
Robust Surgical Phase Recognition From Annotation Efficient Supervision はコメントを受け付けていません
Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration
要約 深層学習ベースの画像復元手法は大幅な進歩を遂げていますが、合成データでのト … 続きを読む
カテゴリー: cs.CV
Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration はコメントを受け付けていません
CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs
要約 科学論文や財務レポートの分析など、現実世界のタスクにマルチモーダル大規模言 … 続きを読む
ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation
要約 私たちは、タイムラプスビデオ生成における T2V モデル (Sora や … 続きを読む
MultiDiff: Consistent Novel View Synthesis from a Single Image
要約 単一の RGB 画像からシーンを一貫して新しいビュー合成するための新しいア … 続きを読む
カテゴリー: cs.CV
MultiDiff: Consistent Novel View Synthesis from a Single Image はコメントを受け付けていません