-
最近の投稿
- Interstellar Object Accessibility and Mission Design
- Continuous Rating as Reliable Human Evaluation of Simultaneous Speech Translation
- Electrokinetic Propulsion for Electronically Integrated Microscopic Robots
- Learning-Based Control Barrier Function with Provably Safe Guarantees: Reducing Conservatism with Heading-Aware Safety Margin
- Faster Algorithms for Growing Collision-Free Convex Polytopes in Robot Configuration Space
-
最近のコメント
表示できるコメントはありません。 cs.AI (29654) cs.CL (22395) cs.CR (2301) cs.CV (36070) cs.LG (34477) cs.RO (17199) cs.SY (2643) eess.IV (4387) eess.SY (2637) stat.ML (4608)
月別アーカイブ: 2024年8月
BoostTrack++: using tracklet information to detect more objects in multiple object tracking
要約 複数オブジェクト追跡 (MOT) は、真陽性で検出された境界ボックスの選択 … 続きを読む
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation
要約 Stable Diffusion に代表されるテキストガイドによる画像生成 … 続きを読む
カテゴリー: cs.CV
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation はコメントを受け付けていません
Collaborative Control for Geometry-Conditioned PBR Image Generation
要約 グラフィックス パイプラインには物理ベース レンダリング (PBR) マテ … 続きを読む
MAML MOT: Multiple Object Tracking based on Meta-Learning
要約 ビデオ分析技術の進歩に伴い、歩行者が関与する複雑なシーンにおけるマルチオブ … 続きを読む
TokenPacker: Efficient Visual Projector for Multimodal LLM
要約 ビジュアル プロジェクターは、マルチモーダル LLM (MLLM) におけ … 続きを読む
カテゴリー: cs.CV
TokenPacker: Efficient Visual Projector for Multimodal LLM はコメントを受け付けていません
Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding
要約 3D オブジェクト アフォーダンス グランディングは、3D オブジェクト上 … 続きを読む
カテゴリー: cs.CV
Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding はコメントを受け付けていません
Indoor scene recognition from images under visual corruptions
要約 屋内シーンの分類は、生活支援のためのインテリジェント ロボット工学などのさ … 続きを読む
カテゴリー: cs.CV
Indoor scene recognition from images under visual corruptions はコメントを受け付けていません
PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments
要約 2 本の指グリッパーを使用したロボット操作は、明確な把握可能な機能が欠けて … 続きを読む
VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models
要約 既存の車両検出器は通常、事前にトレーニングされたバックボーン (ResNe … 続きを読む
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points
要約 最近、ガウシアンを使用したダイナミックなシーンの再構成への関心が高まってい … 続きを読む
カテゴリー: cs.CV
S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points はコメントを受け付けていません