-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving
要約 タイトル:DAMO-StreamNet:自律走行におけるストリーミング知覚 … 続きを読む
DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning
要約 タイトル:DreamArtist:Positive-Negative Pr … 続きを読む
Dance Style Transfer with Cross-modal Transformer
要約 タイトル:クロスモーダルトランスフォーマーを用いたダンススタイルの転移 要 … 続きを読む
Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion
要約 タイトル:マルチグレイン情報融合によるソーシャルメディア上のマルチモーダル … 続きを読む
Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations
要約 タイトル:手順ビデオとその解説から学習手順に関するビデオ表現 要約: &# … 続きを読む
Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective
要約 タイトル:因果関係の観点から画像復元のための歪み不変表現の学習 要約: & … 続きを読む
LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception
要約 タイトル:LongShortNet:ストリーミング知覚における時間的および … 続きを読む
DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving
要約 リアルタイム認識、またはストリーミング認識は、自動運転の重要な側面であり、 … 続きを読む
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research
要約 オーディオ言語 (AL) マルチモーダル学習タスクの進歩は、近年重要です。 … 続きを読む
ProContEXT: Exploring Progressive Context Transformer for Tracking
要約 既存のビジュアル オブジェクト トラッキング (VOT) は、最初のフレー … 続きを読む