月別アーカイブ: 2023年3月

TBP-Former: Learning Temporal Bird’s-Eye-View Pyramid for Joint Perception and Prediction in Vision-Centric Autonomous Driving

要約 視覚中心の共同認識と予測 (PnP) は、自動運転研究の新たなトレンドとな … 続きを読む

カテゴリー: cs.CV | TBP-Former: Learning Temporal Bird’s-Eye-View Pyramid for Joint Perception and Prediction in Vision-Centric Autonomous Driving はコメントを受け付けていません

Autonomous Marker-less Rapid Aerial Grasping

要約 自律型ロボットが登場する未来では、ロボット システムにとって視覚的および空 … 続きを読む

カテゴリー: cs.CV, cs.RO | Autonomous Marker-less Rapid Aerial Grasping はコメントを受け付けていません

WOC: A Handy Webcam-based 3D Online Chatroom

要約 私たちは、ユーザーの 3D モーションをキャプチャし、個々の 3D 仮想ア … 続きを読む

カテゴリー: cs.CV, cs.HC | WOC: A Handy Webcam-based 3D Online Chatroom はコメントを受け付けていません

Stochastic Segmentation with Conditional Categorical Diffusion Models

要約 セマンティック セグメンテーションは、ディープ ニューラル ネットワークの … 続きを読む

カテゴリー: cs.CV | Stochastic Segmentation with Conditional Categorical Diffusion Models はコメントを受け付けていません

SR-init: An interpretable layer pruning method

要約 多くの分野でディープ ニューラル ネットワーク (DNN) が普及している … 続きを読む

カテゴリー: cs.CV | SR-init: An interpretable layer pruning method はコメントを受け付けていません

Multi-modal Expression Recognition with Ensemble Method

要約 この論文は、第 5 回感情行動分析イン ザ ワイルド (ABAW) コンペ … 続きを読む

カテゴリー: cs.CV | Multi-modal Expression Recognition with Ensemble Method はコメントを受け付けていません

Who are you referring to? Coreference resolution in image narrations

要約 共参照の解決は、テキスト内の同じエンティティを参照する単語やフレーズを識別 … 続きを読む

カテゴリー: cs.CL, cs.CV | Who are you referring to? Coreference resolution in image narrations はコメントを受け付けていません

ShaRPy: Shape Reconstruction and Hand Pose Estimation from RGB-D with Uncertainty

要約 それらの可能性にもかかわらず、マーカーレスハンドトラッキング技術は、炎症性 … 続きを読む

カテゴリー: cs.CV | ShaRPy: Shape Reconstruction and Hand Pose Estimation from RGB-D with Uncertainty はコメントを受け付けていません

Uncertainty-informed Mutual Learning for Joint Medical Image Classification and Segmentation

要約 分類とセグメンテーションは、正確な診断と疾患の監視を可能にするため、医用画 … 続きを読む

カテゴリー: cs.CV | Uncertainty-informed Mutual Learning for Joint Medical Image Classification and Segmentation はコメントを受け付けていません

GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation

要約 拡散プロセスに基づくテキストから画像 (T2I) モデルは、ユーザー提供の … 続きを読む

カテゴリー: cs.CV, cs.MM | GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation はコメントを受け付けていません