-
最近の投稿
- Grasp EveryThing (GET): 1-DoF, 3-Fingered Gripper with Tactile Sensing for Robust Grasping
- Neural Inertial Odometry from Lie Events
- Physical synchronization of soft self-oscillating limbs for fast and autonomous locomotion
- CRADMap: Applied Distributed Volumetric Mapping with 5G-Connected Multi-Robots and 4D Radar Perception
- Learning Rock Pushability on Rough Planetary Terrain
-
最近のコメント
表示できるコメントはありません。 cs.AI (38176) cs.CL (28850) cs.CV (43741) cs.HC (2915) cs.LG (43106) cs.RO (22722) cs.SY (3490) eess.IV (5071) eess.SY (3482) stat.ML (5612)
「cs.MM」カテゴリーアーカイブ
Flight Patterns for Swarms of Drones
要約 ドローンの群れが 1 つ以上の開口部を衝突せずに通過するための飛行パターン … 続きを読む
A Benchmark and Robustness Study of In-Context-Learning with Large Language Models in Music Entity Detection
要約 曲のタイトルやアーティスト名などの音楽エンティティの検出は、音楽検索クエリ … 続きを読む
Wills Aligner: Multi-Subject Collaborative Brain Visual Decoding
要約 人間の脳活動から視覚情報を解読することは、最近の研究で目覚ましい進歩を遂げ … 続きを読む
IRR: Image Review Ranking Framework for Evaluating Vision-Language Models
要約 大規模ビジョン言語モデル (LVLM) は、画像とテキストの両方を処理し、 … 続きを読む
EVOS: Efficient Implicit Neural Training via EVOlutionary Selector
要約 私たちは、Implicit Neural Representation ( … 続きを読む
Low-Latency Scalable Streaming for Event-Based Vision
要約 最近、高速、低消費電力のビデオ キャプチャ用の新しい「イベントベース」カメ … 続きを読む
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving
要約 大規模マルチモーダル モデル (LMM) は、大規模な言語モデルを組み込む … 続きを読む
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving
要約 大規模マルチモーダル モデル (LMM) は、大規模な言語モデルを組み込む … 続きを読む
Towards Open-Vocabulary Video Semantic Segmentation
要約 ビデオのセマンティック セグメンテーションは、最近の研究の焦点となっていま … 続きを読む