-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
BoostTrack++: using tracklet information to detect more objects in multiple object tracking
要約 複数オブジェクト追跡 (MOT) は、真陽性で検出された境界ボックスの選択 … 続きを読む
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation
要約 Stable Diffusion に代表されるテキストガイドによる画像生成 … 続きを読む
カテゴリー: cs.CV
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation はコメントを受け付けていません
Collaborative Control for Geometry-Conditioned PBR Image Generation
要約 グラフィックス パイプラインには物理ベース レンダリング (PBR) マテ … 続きを読む
MAML MOT: Multiple Object Tracking based on Meta-Learning
要約 ビデオ分析技術の進歩に伴い、歩行者が関与する複雑なシーンにおけるマルチオブ … 続きを読む
TokenPacker: Efficient Visual Projector for Multimodal LLM
要約 ビジュアル プロジェクターは、マルチモーダル LLM (MLLM) におけ … 続きを読む
カテゴリー: cs.CV
TokenPacker: Efficient Visual Projector for Multimodal LLM はコメントを受け付けていません
Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding
要約 3D オブジェクト アフォーダンス グランディングは、3D オブジェクト上 … 続きを読む
カテゴリー: cs.CV
Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding はコメントを受け付けていません
Indoor scene recognition from images under visual corruptions
要約 屋内シーンの分類は、生活支援のためのインテリジェント ロボット工学などのさ … 続きを読む
カテゴリー: cs.CV
Indoor scene recognition from images under visual corruptions はコメントを受け付けていません
PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments
要約 2 本の指グリッパーを使用したロボット操作は、明確な把握可能な機能が欠けて … 続きを読む
VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models
要約 既存の車両検出器は通常、事前にトレーニングされたバックボーン (ResNe … 続きを読む
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points
要約 最近、ガウシアンを使用したダイナミックなシーンの再構成への関心が高まってい … 続きを読む
カテゴリー: cs.CV
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points はコメントを受け付けていません