-
最近の投稿
- Grasp EveryThing (GET): 1-DoF, 3-Fingered Gripper with Tactile Sensing for Robust Grasping
- Neural Inertial Odometry from Lie Events
- Physical synchronization of soft self-oscillating limbs for fast and autonomous locomotion
- CRADMap: Applied Distributed Volumetric Mapping with 5G-Connected Multi-Robots and 4D Radar Perception
- Learning Rock Pushability on Rough Planetary Terrain
-
最近のコメント
表示できるコメントはありません。 cs.AI (38176) cs.CL (28850) cs.CV (43741) cs.HC (2915) cs.LG (43106) cs.RO (22722) cs.SY (3490) eess.IV (5071) eess.SY (3482) stat.ML (5612)
「cs.MM」カテゴリーアーカイブ
Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training
要約 自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む
GSVC: Efficient Video Representation and Compression Through 2D Gaussian Splatting
要約 3D ガウス スプラットは、静的な 3D シーンの革新的で効果的な学習され … 続きを読む
Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes
要約 3D ガウス スプラッティング (3DGS) は、3D シーンのフォトリア … 続きを読む
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation
要約 表情豊かな人間の姿勢と形状の推定 (EHPS) は、体、手、顔のモーション … 続きを読む
CLIP-PCQA: Exploring Subjective-Aligned Vision-Language Modeling for Point Cloud Quality Assessment
要約 近年、無参照点群品質評価 (NR-PCQA) 研究は大きな進歩を遂げていま … 続きを読む
Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework
要約 リモート センシング変化キャプション (RSICC) は、両時間画像間の変 … 続きを読む
Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation
要約 この論文では、コンピューター ビジョンの Frechet Inceptio … 続きを読む
Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning
要約 メトリクス学習はサンプルを埋め込み空間に投影し、そこで学習された表現に基づ … 続きを読む
Multimodal LLMs Can Reason about Aesthetics in Zero-Shot
要約 我々は、芸術作品の美しさを評価するためにマルチモーダルLLM(MLLM)の … 続きを読む