-
最近の投稿
- Predicting center of mass position in non-cyclic activities: The influence of acceleration, prediction horizon, and ground reaction forces
- Are Transformers Truly Foundational for Robotics?
- Performance Evaluation of Deep Learning-Based State Estimation: A Comparative Study of KalmanNet
- Performance Assessment of Lidar Odometry Frameworks: A Case Study at the Australian Botanic Garden Mount Annan
- VLM-Social-Nav: Socially Aware Robot Navigation through Scoring using Vision-Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (30189) cs.CL (22805) cs.CR (2340) cs.CV (36561) cs.LG (35013) cs.RO (17553) cs.SY (2697) eess.IV (4453) eess.SY (2691) stat.ML (4664)
「cs.MM」カテゴリーアーカイブ
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation
要約 我々は、ビデオの異常検出のための非常に高速なフレームレベルのモデルを提案し … 続きを読む
RT-LA-VocE: Real-Time Low-SNR Audio-Visual Speech Enhancement
要約 このペーパーでは、今後の入力に依存せずに、ライブ ビデオ ストリームとノイ … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む
Frieren: Efficient Video-to-Audio Generation with Rectified Flow Matching
要約 ビデオ – オーディオ (V2A) 生成は、サイレント ビデオ … 続きを読む
Resolving Sentiment Discrepancy for Multimodal Sentiment Detection via Semantics Completion and Decomposition
要約 近年のソーシャル メディア投稿の急増に伴い、マルチモーダル (画像とテキス … 続きを読む
Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack
要約 オンライン ポータルを通じて合成開口レーダー (SAR) 画像に幅広くアク … 続きを読む
Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは人間の社会的行動、感情、認知の重要な要素です。 その自動理解によ … 続きを読む
MERGE — A Bimodal Dataset for Static Music Emotion Recognition
要約 音楽感情認識 (MER) 分野は、特徴エンジニアリング、機械学習、深層学習 … 続きを読む
Pseudo-triplet Guided Few-shot Composed Image Retrieval
要約 合成画像検索 (CIR) は、マルチモーダル クエリ (参照画像とそれに対 … 続きを読む