-
最近の投稿
- Robotic Sim-to-Real Transfer for Long-Horizon Pick-and-Place Tasks in the Robotic Sim2Real Competition
- Fast and Robust Localization for Humanoid Soccer Robot via Iterative Landmark Matching
- Enhancing Adaptivity of Two-Fingered Object Reorientation Using Tactile-based Online Optimization of Deconstructed Actions
- Distributed Multi-robot Source Seeking in Unknown Environments with Unknown Number of Sources
- Fish Mouth Inspired Origami Gripper for Robust Multi-Type Underwater Grasping
-
最近のコメント
表示できるコメントはありません。 cs.AI (35165) cs.CL (26589) cs.CR (2693) cs.CV (41008) cs.LG (40175) cs.RO (20667) cs.SY (3135) eess.IV (4846) eess.SY (3129) stat.ML (5277)
月別アーカイブ: 2025年1月
HSRMamba: Contextual Spatial-Spectral State Space Model for Single Hyperspectral Super-Resolution
要約 Mambaは、強力なグローバルモデリング機能と線形計算の複雑さにより、視覚 … 続きを読む
CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction
要約 大規模な言語モデル(LLM)画像認識は、画像からデータを抽出するための強力 … 続きを読む
Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement
要約 低光および水中画像の強化などの画像強化タスクでは、劣化した画像は、照明の変 … 続きを読む
カテゴリー: cs.CV
Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement はコメントを受け付けていません
Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection
要約 高密度のアクション検出には、トリミングされていないビデオで複数の共起アクシ … 続きを読む
カテゴリー: cs.CV
Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection はコメントを受け付けていません
Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration
要約 アンダーディスプレイカメラ(UDC)には、ディスプレイパネルの下にデジタル … 続きを読む
カテゴリー: cs.CV
Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration はコメントを受け付けていません
LLaRA: Supercharging Robot Learning Data for Vision-Language Policy
要約 ビジョン言語モデル(VLM)は最近、ロボットアクションを生成するために活用 … 続きを読む
Temporal Preference Optimization for Long-Form Video Understanding
要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む
Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models
要約 大規模なビジョン言語モデル(VLM)は、幅広いタスクで顕著なパフォーマンス … 続きを読む
Mini-ResEmoteNet: Leveraging Knowledge Distillation for Human-Centered Design
要約 顔の感情認識は、ユーザーエクスペリエンスのドメイン、特に最新のユーザビリテ … 続きを読む
カテゴリー: cs.CV
Mini-ResEmoteNet: Leveraging Knowledge Distillation for Human-Centered Design はコメントを受け付けていません
Learning Priors of Human Motion With Vision Transformers
要約 人間がシナリオのどこに移動するか、通常のパスと速度、そして停止する場所を明 … 続きを読む