-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting
要約 シーン合成における最近の進歩により、レンダリング目標を使用したハイパープリ … 続きを読む
カテゴリー: cs.CV
DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting はコメントを受け付けていません
SIMS: Simulating Human-Scene Interactions with Real World Script Planning
要約 長期にわたるヒューマンシーンとシーンのインタラクションをシミュレートするこ … 続きを読む
On Domain-Specific Post-Training for Multimodal Large Language Models
要約 近年、一般的なマルチモーダル大規模言語モデル (MLLM) の急速な発展が … 続きを読む
MoSca: Dynamic Gaussian Fusion from Casual Videos via 4D Motion Scaffolds
要約 野生で何気なく撮影された単眼ビデオからダイナミックなシーンの斬新なビューを … 続きを読む
VLSBench: Unveiling Visual Leakage in Multimodal Safety
要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む
Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark
要約 2023 年版の成功に続き、最先端のビデオ モデルのベンチマークと測定を目 … 続きを読む
Free-form Generation Enhances Challenging Clothed Human Modeling
要約 リアルなアニメーション人間アバターを実現するには、ポーズに依存する衣服の変 … 続きを読む
Reanimating Images using Neural Representations of Dynamic Stimuli
要約 コンピューター ビジョン モデルは、静的画像認識において驚くべき進歩を遂げ … 続きを読む
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation
要約 データセットの蒸留における最近の進歩により、2 つの主な方向での解決策が導 … 続きを読む
AlphaTablets: A Generic Plane Representation for 3D Planar Reconstruction from Monocular Videos
要約 AlphaTablets は、連続的な 3D 表面と正確な境界描写を特徴と … 続きを読む