-
最近の投稿
- RT-cache: Efficient Robot Trajectory Retrieval System
- Reach-Avoid-Stabilize Using Admissible Control Sets
- Solving Reach- and Stabilize-Avoid Problems Using Discounted Reachability
- A Novel 6-axis Force/Torque Sensor Using Inductance Sensors
- Deployable and Generalizable Motion Prediction: Taxonomy, Open Challenges and Future Directions
-
最近のコメント
表示できるコメントはありません。 cs.AI (38110) cs.CL (28797) cs.CV (43686) cs.HC (2911) cs.LG (43032) cs.RO (22672) cs.SY (3480) eess.IV (5065) eess.SY (3472) stat.ML (5604)
「cs.MM」カテゴリーアーカイブ
Lester: rotoscope animation through video object segmentation and tracking
要約 この記事では、ビデオからレトロスタイルの 2D アニメーションを自動的に合 … 続きを読む
MM-Point: Multi-View Information-Enhanced Multi-Modal Self-Supervised 3D Point Cloud Understanding
要約 知覚では、複数の感覚情報が統合されて、2D ビューからの視覚情報が 3D … 続きを読む
Leveraging Pre-Trained Autoencoders for Interpretable Prototype Learning of Music Audio
要約 我々は、プロトタイプ学習に基づいた音楽オーディオ分類の解釈可能なモデル P … 続きを読む
LL-GABR: Energy Efficient Live Video Streaming Using Reinforcement Learning
要約 近年、ライブ ビデオ ストリーミング用のアダプティブ ビットレート (AB … 続きを読む
Customizable Perturbation Synthesis for Robust SLAM Benchmarking
要約 堅牢性は、非構造化環境、特に同時ローカリゼーションとマッピング (SLAM … 続きを読む
Test-Time Backdoor Attacks on Multimodal Large Language Models
要約 バックドア攻撃は通常、トレーニング データを汚染することによって実行され、 … 続きを読む
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data
要約 テキストと画像の両方を含むマルチモーダルな入力に応じて感情制御されたフィー … 続きを読む
Human Aesthetic Preference-Based Large Text-to-Image Model Personalization: Kandinsky Generation as an Example
要約 ニューラル生成機能の進歩に伴い、アート コミュニティは絵画コンテンツの作成 … 続きを読む
Quantifying and Enhancing Multi-modal Robustness with Modality Preference
要約 マルチモーダル モデルは、さまざまなソースからの情報を効果的に統合する有望 … 続きを読む
Scalable Diffusion Models with State Space Backbone
要約 この論文は、状態空間アーキテクチャに基づいて構築された拡散モデルのカテゴリ … 続きを読む