-
最近の投稿
- Learn With Imagination: Safe Set Guided State-wise Constrained Policy Optimization
- Effects of Muscle Synergy during Overhead Work with a Passive Shoulder Exoskeleton: A Case Study
- Development of a Low-Cost Prosthetic Hand Using Electromyography and Machine Learning
- Teaching Shortest Path Algorithms With a Robot and Overlaid Projections
- Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly
-
最近のコメント
表示できるコメントはありません。 cs.AI (30124) cs.CL (22755) cs.CR (2336) cs.CV (36490) cs.LG (34945) cs.RO (17504) cs.SY (2689) eess.IV (4444) eess.SY (2683) stat.ML (4656)
「cs.MM」カテゴリーアーカイブ
PC$^2$: Pseudo-Classification Based Pseudo-Captioning for Noisy Correspondence Learning in Cross-Modal Retrieval
要約 クロスモーダル検索の領域では、マルチメディア内の多様なモダリティをシームレ … 続きを読む
Hallu-PI: Evaluating Hallucination in Multi-modal Large Language Models within Perturbed Inputs
要約 マルチモーダル大規模言語モデル(MLLM)は、様々な視覚言語理解・生成タス … 続きを読む
Toward Automatic Relevance Judgment using Vision–Language Models for Image–Text Retrieval Evaluation
要約 Vision–Language Models(VLM)は、様々 … 続きを読む
ChordSync: Conformer-Based Alignment of Chord Annotations to Music Audio
要約 西洋音楽の伝統において、和音は和声の主要な構成要素であり、音楽の基本的な側 … 続きを読む
GalleryGPT: Analyzing Paintings with Large Multimodal Models
要約 作品分析は、個人の美的感性を豊かにし、批評的思考能力を促進する、美術鑑賞の … 続きを読む
Learned Compression of Point Cloud Geometry and Attributes in a Single Model through Multimodal Rate-Control
要約 点群圧縮は、必要なストリーミングデータレートを大幅に削減するため、ボリュー … 続きを読む
Towards Assessing Data Replication in Music Generation with Music Similarity Metrics on Raw Audio
要約 音楽生成における最近の進歩により、創造的な音楽プロセス、現在のビジネス モ … 続きを読む
KeyVideoLLM: Towards Large-scale Video Keyframe Selection
要約 最近、Web ビデオの台頭により、大規模なビデオ データセットの管理と理解 … 続きを読む
Can LLMs ‘Reason’ in Music? An Evaluation of LLMs’ Capability of Music Understanding and Generation
要約 言語に似た記号音楽は、個別の記号でエンコードできます。 最近の研究では、G … 続きを読む
Open-Vocabulary Audio-Visual Semantic Segmentation
要約 オーディオビジュアル セマンティック セグメンテーション (AVSS) は … 続きを読む