-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「I.2.10」カテゴリーアーカイブ
Inferring the Future by Imagining the Past
要約 漫画の 1 コマは多くのことを語ることができます。キャラクターが現在どこに … 続きを読む
Towards Improved Input Masking for Convolutional Neural Networks
要約 機械学習モデルの入力から特徴を削除する機能は、モデルの予測を理解して解釈す … 続きを読む
SEM-GAT: Explainable Semantic Pose Estimation using Learned Graph Attention
要約 この論文では、セマンティクスとローカル ジオメトリを活用して、信頼できる点 … 続きを読む
Invariance is Key to Generalization: Examining the Role of Representation in Sim-to-Real Transfer for Visual Navigation
要約 ロボット制御へのデータ駆動型アプローチは急速に進んでいますが、目に見えない … 続きを読む
A Human-Robot Mutual Learning System with Affect-Grounded Language Acquisition and Differential Outcomes Training
要約 この論文では、ロボットとロボットの恒常性のニーズを特定するための記号言語の … 続きを読む
ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting
要約 拡散ベースの画像超解像度 (SR) 手法は、数百、さらには数千のサンプリン … 続きを読む
Getting ViT in Shape: Scaling Laws for Compute-Optimal Model Design
要約 最近、特定の計算期間における計算に最適なモデル サイズ (パラメーターの数 … 続きを読む
FocDepthFormer: Transformer with LSTM for Depth Estimation from Focus
要約 焦点スタックからの深度推定は、画像スタック内の焦点/焦点ぼけの手がかりから … 続きを読む
Training and Predicting Visual Error for Real-Time Applications
要約 視覚的エラー メトリックは、知覚される画像の類似性の定量化において基本的な … 続きを読む
Revisiting Data Augmentation for Rotational Invariance in Convolutional Neural Networks
要約 畳み込みニューラル ネットワーク (CNN) は、さまざまなコンピューター … 続きを読む