-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
月別アーカイブ: 2024年6月
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis
要約 汎用人工知能の探求において、マルチモーダル大規模言語モデル (MLLM) … 続きを読む
URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images
要約 視覚的にも物理的にも現実的なシミュレーション シーンを構築することは、ロボ … 続きを読む
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction
要約 シングルビュー画像から 3D シーン表現を学習することは、入力ビューからは … 続きを読む
カテゴリー: cs.CV
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction はコメントを受け付けていません
Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals
要約 正確な骨の追跡は、整形外科や義肢ロボット工学における運動学的解析にとって非 … 続きを読む
Iterative Feature Boosting for Explainable Speech Emotion Recognition
要約 音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴 … 続きを読む
Visual Attention Analysis in Online Learning
要約 このペーパーでは、マルチモーダル学習分析分野におけるアプローチを紹介します … 続きを読む
Scaling White-Box Transformers for Vision
要約 CRATE は、圧縮表現とスパース表現を学習するために設計されたホワイトボ … 続きを読む
カテゴリー: cs.CV
Scaling White-Box Transformers for Vision はコメントを受け付けていません
ParSEL: Parameterized Shape Editing with Language
要約 自然言語から 3D アセットを編集できる機能は、3D コンテンツ作成の民主 … 続きを読む
4DHands: Reconstructing Interactive Hands in 4D with Transformers
要約 この論文では、インタラクティブなハンド メッシュとその相対的な動きを単眼入 … 続きを読む