-
最近の投稿
- Learn With Imagination: Safe Set Guided State-wise Constrained Policy Optimization
- Effects of Muscle Synergy during Overhead Work with a Passive Shoulder Exoskeleton: A Case Study
- Development of a Low-Cost Prosthetic Hand Using Electromyography and Machine Learning
- Teaching Shortest Path Algorithms With a Robot and Overlaid Projections
- Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly
-
最近のコメント
表示できるコメントはありません。 cs.AI (30124) cs.CL (22755) cs.CR (2336) cs.CV (36490) cs.LG (34945) cs.RO (17504) cs.SY (2689) eess.IV (4444) eess.SY (2683) stat.ML (4656)
「cs.MM」カテゴリーアーカイブ
Inter-Frame Compression for Dynamic Point Cloud Geometry Coding
要約 効率的な点群圧縮は、仮想現実や複合現実、自律走行、文化遺産などのアプリケー … 続きを読む
TALDS-Net: Task-Aware Adaptive Local Descriptors Selection for Few-shot Image Classification
要約 数ショットの画像分類は、少ないサンプルで未知の新規クラスから画像を分類する … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion
要約 キャラクターを認識し、会話の話者を予測することは、音声生成や翻訳などのコミ … 続きを読む
MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model
要約 このペーパーでは、マルチイメージ推論におけるマルチモーダル大規模言語モデル … 続きを読む
DreamCinema: Cinematic Transfer with Free Camera and 3D Character
要約 私たちはデジタル メディアの隆盛の時代に生きており、誰もが個人の映画製作者 … 続きを読む
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context
要約 ビジュアルストーリーテリングでは、文字とシーンの一貫性を維持しながら、テキ … 続きを読む
Self-supervised Photographic Image Layout Representation Learning
要約 画像レイアウト表現学習の領域では、画像レイアウトを簡潔なベクトル形式に変換 … 続きを読む
Anim-Director: A Large Multimodal Model Powered Agent for Controllable Animation Video Generation
要約 従来のアニメーション生成方法は、人間がラベル付けしたデータを使用した生成モ … 続きを読む