-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
月別アーカイブ: 2024年5月
Visualize and Paint GAN Activations
要約 私たちは、これらのモデルの内部動作をより深く理解し、無条件にトレーニングさ … 続きを読む
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition
要約 長いビデオのエンドツーエンドのアクション認識モデルを開発することは、長いビ … 続きを読む
カテゴリー: cs.CV
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition はコメントを受け付けていません
M4U: Evaluating Multilingual Understanding and Reasoning for Large Multimodal Models
要約 多言語マルチモーダル推論は、人間レベルの知能を達成するための中心的なコンポ … 続きを読む
Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model
要約 人間とオブジェクトの相互作用 (HOI) 検出は、人間とオブジェクトのペア … 続きを読む
カテゴリー: cs.CV
Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model はコメントを受け付けていません
GLiDR: Topologically Regularized Graph Generative Network for Sparse LiDAR Point Clouds
要約 LiDAR 点群がまばらであると、静的構造の詳細が大幅に失われ、ナビゲーシ … 続きを読む
HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation
要約 新しく提案された Generalized Referring Expres … 続きを読む
Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition
要約 Low-Light Video Enhancement (LLVE) は、 … 続きを読む
カテゴリー: cs.CV
Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition はコメントを受け付けていません
MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion
要約 既存のテキストから画像へのモデルは、複数のオブジェクトの画像を生成するのに … 続きを読む
カテゴリー: cs.CV
MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion はコメントを受け付けていません
Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables
要約 画像分類におけるディープラーニングの台頭により、前例のない精度がもたらされ … 続きを読む
GroundGrid:LiDAR Point Cloud Ground Segmentation and Terrain Estimation
要約 正確な点群の地面セグメンテーションは、自動運転車の LiDAR センサーの … 続きを読む