-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Deeply-Coupled Convolution-Transformer with Spatial-temporal Complementary Learning for Video-based Person Re-identification
要約 タイトル:深い相互コンビューション・空間・時間相補的学習を持つ転送器を用い … 続きを読む
Figments and Misalignments: A Framework for Fine-grained Crossmodal Misinformation Detection
要約 タイトル:フィグメンツとミスアライメント:細かい交差モーダルの誤情報検出の … 続きを読む
Listen2Scene: Interactive material-aware binaural sound propagation for reconstructed 3D scenes
要約 タイトル:再構成された3Dシーンのためのインタラクティブな物質に注意を払っ … 続きを読む
TCR: Short Video Title Generation and Cover Selection with Attention Refinement
要約 タイトル:TCR:アテンションリファインメントによる短い動画のタイトル生成 … 続きを読む
Listen2Scene: Interactive material-aware binaural soundbpropagation for reconstructed 3D scenes
要約 タイトル: Listen2Scene:再構築された3Dシーンのためのインタ … 続きを読む
MMC: Multi-Modal Colorization of Images using Textual Descriptions
要約 タイトル:テキスト説明を用いた画像のマルチモーダルカラーリング(MMC) … 続きを読む
TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection
要約 タイトル:多様な憎悪検知のためのトポロジー認識最適輸送 要約: ̵ … 続きを読む
Robust and Efficient Memory Network for Video Object Segmentation
要約 タイトル:ビデオオブジェクトセグメンテーションのための堅牢かつ効率的なメモ … 続きを読む
MMC: Multi-Modal Colorization of Images using Textual Descriptions
要約 タイトル:テキスト記述を用いたマルチモーダル画像着色(MMC: Multi … 続きを読む
GRIG: Few-Shot Generative Residual Image Inpainting
要約 タイトル:GRIG: Few-Shot Generative Residu … 続きを読む