-
最近の投稿
- DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning
- Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning
- SeePerSea: Multi-modal Perception Dataset of In-water Objects for Autonomous Surface Vehicles
- FastUMI: A Scalable and Hardware-Independent Universal Manipulation Interface with Dataset
- Gaze-based Task Decomposition for Robot Manipulation in Imitation Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (33149) cs.CL (25043) cs.CR (2564) cs.CV (39236) cs.LG (38060) cs.RO (19259) cs.SY (2948) eess.IV (4699) eess.SY (2942) stat.ML (5009)
「I.2.10」カテゴリーアーカイブ
Generative AI Models: Opportunities and Risks for Industry and Authorities
要約 ジェネレーティブAIモデルは、従来は創造性や人間の理解が必要であった様々な … 続きを読む
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models
要約 リモートセンシングにおける豊富で適切にアノテーションされたマルチモーダルデ … 続きを読む
A Multi-Modal Explainability Approach for Human-Aware Robots in Multi-Party Conversation
要約 宛先の推定(誰かが話している人への理解)は、マルチパーティの会話シナリオに … 続きを読む
Conterfactual Generative Zero-Shot Semantic Segmentation
要約 ゼロショット学習は、コンピュータービジョンの重要な部分です。 古典的なダウ … 続きを読む
Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics
要約 Fiducialマーカーは、さまざまなロボットタスクで広く使用されており、 … 続きを読む
Dream to Fly: Model-Based Reinforcement Learning for Vision-Based Drone Flight
要約 自律型ドローンレースは、学習、認識、計画、制御の限界をテストするための挑戦 … 続きを読む
A 65 nm Bayesian Neural Network Accelerator with 360 fJ/Sample In-Word GRNG for AI Uncertainty Estimation
要約 不確実性の推定は、AI 対応の安全性が重要なアプリケーションにとって不可欠 … 続きを読む
BlanketGen2-Fit3D: Synthetic Blanket Augmentation Towards Improving Real-World In-Bed Blanket Occluded Human Pose Estimation
要約 単眼 RGB 画像からの人間の姿勢推定 (HPE) は、臨床ベッド内での骨 … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む
Reducing the Sensitivity of Neural Physics Simulators to Mesh Topology via Pretraining
要約 メッシュは、レーダー センシングや空気力学など、さまざまな領域にわたる高忠 … 続きを読む