-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
PromptMono: Cross Prompting Attention for Self-Supervised Monocular Depth Estimation in Challenging Environments
要約 理想的な条件下での単眼深度の推定を改善するためにかなりの努力が払われていま … 続きを読む
カテゴリー: cs.CV
PromptMono: Cross Prompting Attention for Self-Supervised Monocular Depth Estimation in Challenging Environments はコメントを受け付けていません
3DGSR: Implicit Surface Reconstruction with 3D Gaussian Splatting
要約 この論文では、3D ガウス スプラッティング (3DGS) を使用した陰的 … 続きを読む
EgoHand: Ego-centric Hand Pose Estimation and Gesture Recognition with Head-mounted Millimeter-wave Radar and IMUs
要約 Apple Vision Pro などの最近の高度な仮想現実 (VR) ヘ … 続きを読む
カテゴリー: cs.CV
EgoHand: Ego-centric Hand Pose Estimation and Gesture Recognition with Head-mounted Millimeter-wave Radar and IMUs はコメントを受け付けていません
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind
要約 複雑な現実世界のシナリオで人々の社会的相互作用を理解することは、しばしば複 … 続きを読む
By-Example Synthesis of Vector Textures
要約 単一のラスターの模範を考慮して、任意のサイズの新しいベクトルテクスチャを合 … 続きを読む
Ensuring Medical AI Safety: Explainable AI-Driven Detection and Mitigation of Spurious Model Behavior and Associated Data
要約 ディープ ニューラル ネットワークは、実際には致命的な結果をもたらす可能性 … 続きを読む
Video-MMMU: Evaluating Knowledge Acquisition from Multi-Discipline Professional Videos
要約 人間は、情報の知覚、知識の理解、新しい問題を解決するために知識を適応させる … 続きを読む
MV-GMN: State Space Model for Multi-View Action Recognition
要約 マルチビューアクション認識の最近の進歩は、トランスベースのモデルに大きく依 … 続きを読む
カテゴリー: cs.CV
MV-GMN: State Space Model for Multi-View Action Recognition はコメントを受け付けていません
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation
要約 拡散モデルは、視覚生成の支配的なアプローチとなっています。 彼らは、入力に … 続きを読む
Where Do You Go? Pedestrian Trajectory Prediction using Scene Features
要約 歩行者の軌跡を正確に予測することは、自動運転車の安全性を高め、歩行者が巻き … 続きを読む