-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
A Practitioner’s Guide to Continual Multimodal Pretraining
要約 マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む
CompCap: Improving Multimodal Large Language Models with Composite Captions
要約 マルチモーダル大規模言語モデル (MLLM) は合成画像をどの程度理解でき … 続きを読む
From classical techniques to convolution-based models: A review of object detection algorithms
要約 オブジェクト検出は、コンピューター ビジョンと画像理解における基本的なタス … 続きを読む
Extrapolated Urban View Synthesis Benchmark
要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む
Sparse autoencoders reveal selective remapping of visual concepts during adaptation
要約 基礎モデルを特定の目的に適合させることは、下流アプリケーション用の機械学習 … 続きを読む
Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model
要約 現実的な自動運転シミュレーターの開発には4D運転シミュレーションが不可欠で … 続きを読む
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding
要約 3D 占有予測は周囲のシーンの包括的な説明を提供し、3D 認識にとって不可 … 続きを読む
GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction
要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む
From interpretability to inference: an estimation framework for universal approximators
要約 私たちは、広範なクラスの汎用近似器を使用した推定と推論のための新しいフレー … 続きを読む
Learning Speed-Adaptive Walking Agent Using Imitation Learning with Physics-Informed Simulation
要約 人間の歩行の仮想モデル、つまりデジタル ツインは、労働集約的なデータ収集を … 続きを読む