-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「cs.MM」カテゴリーアーカイブ
Customizable Perturbation Synthesis for Robust SLAM Benchmarking
要約 堅牢性は、非構造化環境、特に同時ローカリゼーションとマッピング (SLAM … 続きを読む
Test-Time Backdoor Attacks on Multimodal Large Language Models
要約 バックドア攻撃は通常、トレーニング データを汚染することによって実行され、 … 続きを読む
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data
要約 テキストと画像の両方を含むマルチモーダルな入力に応じて感情制御されたフィー … 続きを読む
Human Aesthetic Preference-Based Large Text-to-Image Model Personalization: Kandinsky Generation as an Example
要約 ニューラル生成機能の進歩に伴い、アート コミュニティは絵画コンテンツの作成 … 続きを読む
Quantifying and Enhancing Multi-modal Robustness with Modality Preference
要約 マルチモーダル モデルは、さまざまなソースからの情報を効果的に統合する有望 … 続きを読む
Scalable Diffusion Models with State Space Backbone
要約 この論文は、状態空間アーキテクチャに基づいて構築された拡散モデルのカテゴリ … 続きを読む
Accelerated Event-Based Feature Detection and Compression for Surveillance Video Systems
要約 監視ビデオの強力な時間的一貫性により、従来の方法で魅力的な圧縮パフォーマン … 続きを読む
Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos
要約 ビデオ アクション セグメンテーションは、多くの分野で広く適用されています … 続きを読む
Diffusion Models, Image Super-Resolution And Everything: A Survey
要約 拡散モデル (DM) は、画像の超解像度 (SR) 分野を破壊し、画質と人 … 続きを読む