-
最近の投稿
- Learn With Imagination: Safe Set Guided State-wise Constrained Policy Optimization
- Effects of Muscle Synergy during Overhead Work with a Passive Shoulder Exoskeleton: A Case Study
- Development of a Low-Cost Prosthetic Hand Using Electromyography and Machine Learning
- Teaching Shortest Path Algorithms With a Robot and Overlaid Projections
- Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly
-
最近のコメント
表示できるコメントはありません。 cs.AI (30124) cs.CL (22755) cs.CR (2336) cs.CV (36490) cs.LG (34945) cs.RO (17504) cs.SY (2689) eess.IV (4444) eess.SY (2683) stat.ML (4656)
「cs.MM」カテゴリーアーカイブ
Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization
要約 最近、新しい形式の音声部分偽造がフォレンジックに課題をもたらしており、長時 … 続きを読む
FakingRecipe: Detecting Fake News on Short Video Platforms from the Perspective of Creative Process
要約 ショートビデオ共有プラットフォームがニュース消費の重要なチャネルになるにつ … 続きを読む
360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation
要約 VR関連技術の発展により、視聴者はヘッドマウントディスプレイを通じてリアル … 続きを読む
HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning
要約 幻覚は大規模な言語モデルにとって大きな問題であり、視覚言語モデル (VLM … 続きを読む
Multimodal Misinformation Detection using Large Vision-Language Models
要約 誤った情報の蔓延とその憂慮すべき影響により、産業界と学界の両方が誤った情報 … 続きを読む
Towards Assessing Data Replication in Music Generation with Music Similarity Metrics on Raw Audio
要約 音楽生成における最近の進歩により、創造的な音楽プロセス、現在のビジネス モ … 続きを読む
Aligning Sight and Sound: Advanced Sound Source Localization Through Audio-Visual Alignment
要約 学習ベースの音源定位に関する最近の研究は、主に定位パフォーマンスの観点に焦 … 続きを読む
Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation
要約 この研究では、シーンのテキストをソース言語 (ヒンディー語など) からター … 続きを読む
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation
要約 我々は、ビデオの異常検出のための非常に高速なフレームレベルのモデルを提案し … 続きを読む