-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis
要約 汎用人工知能の探求において、マルチモーダル大規模言語モデル (MLLM) … 続きを読む
URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images
要約 視覚的にも物理的にも現実的なシミュレーション シーンを構築することは、ロボ … 続きを読む
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction
要約 シングルビュー画像から 3D シーン表現を学習することは、入力ビューからは … 続きを読む
カテゴリー: cs.CV
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction はコメントを受け付けていません
Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals
要約 正確な骨の追跡は、整形外科や義肢ロボット工学における運動学的解析にとって非 … 続きを読む
Iterative Feature Boosting for Explainable Speech Emotion Recognition
要約 音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴 … 続きを読む
Visual Attention Analysis in Online Learning
要約 このペーパーでは、マルチモーダル学習分析分野におけるアプローチを紹介します … 続きを読む
Scaling White-Box Transformers for Vision
要約 CRATE は、圧縮表現とスパース表現を学習するために設計されたホワイトボ … 続きを読む
カテゴリー: cs.CV
Scaling White-Box Transformers for Vision はコメントを受け付けていません
ParSEL: Parameterized Shape Editing with Language
要約 自然言語から 3D アセットを編集できる機能は、3D コンテンツ作成の民主 … 続きを読む
4DHands: Reconstructing Interactive Hands in 4D with Transformers
要約 この論文では、インタラクティブなハンド メッシュとその相対的な動きを単眼入 … 続きを読む