-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Recovering Sign Bits of DCT Coefficients in Digital Images as an Optimization Problem
要約 DCT 係数の不明な情報、欠落情報、破損情報、歪んだ情報、または失われた情 … 続きを読む
Universal Perturbation Attack on Differentiable No-Reference Image- and Video-Quality Metrics
要約 普遍的な敵対的摂動攻撃は、畳み込みニューラル ネットワークを使用する画像分 … 続きを読む
Point-Syn2Real: Semi-Supervised Synthetic-to-Real Cross-Domain Learning for Object Classification in 3D Point Clouds
要約 LiDAR 3D 点群データを使用したオブジェクト分類は、自動運転などの最 … 続きを読む
Combining Automatic Speaker Verification and Prosody Analysis for Synthetic Speech Detection
要約 メディア コンテンツ合成技術の急速な普及と、オーディオとビデオのディープフ … 続きを読む
ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network
要約 このホワイト ペーパーでは、ViGAT と呼ばれる純粋な注意のボトムアップ … 続きを読む
FedVMR: A New Federated Learning method for Video Moment Retrieval
要約 大きな成功を収めたにもかかわらず、既存のビデオ モーメント検索 (VMR) … 続きを読む
Temporal Sentence Grounding in Videos: A Survey and Future Directions
要約 ビデオにおける時間的文のグラウンディング (TSGV)、別名自然言語ビデオ … 続きを読む
Leveraging Computer Vision Application in Visual Arts: A Case Study on the Use of Residual Neural Network to Classify and Analyze Baroque Paintings
要約 大規模なデジタル化された美術コレクションの利用可能性が高まるにつれて、絵画 … 続きを読む
TPFNet: A Novel Text In-painting Transformer for Text Removal
要約 画像からのテキスト消去は、画像の編集やプライバシーの保護など、さまざまなタ … 続きを読む
ProContEXT: Exploring Progressive Context Transformer for Tracking
要約 既存のビジュアル オブジェクト トラッキング (VOT) は、最初のフレー … 続きを読む