cs.CV」カテゴリーアーカイブ

Estimating Body and Hand Motion in an Ego-sensed World

要約 ヘッドマウントデバイスから人間の動作を推定するシステム EgoAllo を … 続きを読む

カテゴリー: cs.AI, cs.CV | Estimating Body and Hand Motion in an Ego-sensed World はコメントを受け付けていません

BanglishRev: A Large-Scale Bangla-English and Code-mixed Dataset of Product Reviews in E-Commerce

要約 この研究では、BanglishRev データセットを紹介します。これは、英 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | BanglishRev: A Large-Scale Bangla-English and Code-mixed Dataset of Product Reviews in E-Commerce はコメントを受け付けていません

Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild

要約 実際の動的表情認識 (DFER) は、感情に関連した表情を認識する際に大き … 続きを読む

カテゴリー: cs.AI, cs.CV | Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild はコメントを受け付けていません

Locate n’ Rotate: Two-stage Openable Part Detection with Foundation Model Priors

要約 多関節オブジェクトの開閉可能な部分を検出することは、引き出しを引き出すなど … 続きを読む

カテゴリー: cs.CV | Locate n’ Rotate: Two-stage Openable Part Detection with Foundation Model Priors はコメントを受け付けていません

ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection

要約 顔ランドマーク検出 (FLD) は大幅な進歩を遂げていますが、既存の FL … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection はコメントを受け付けていません

NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment

要約 単眼内視鏡ビデオからの同時位置特定とマッピング (SLAM) により、自律 … 続きを読む

カテゴリー: cs.CV | NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment はコメントを受け付けていません

Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration

要約 視覚言語モデルの高速化に関する最近の研究では、視覚情報が高度に圧縮されてい … 続きを読む

カテゴリー: cs.CV | Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration はコメントを受け付けていません

Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures

要約 スパース ビュー RGB 入力からのリアルタイム フリー ビュー ヒューマ … 続きを読む

カテゴリー: cs.CV | Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures はコメントを受け付けていません

Move-in-2D: 2D-Conditioned Human Motion Generation

要約 リアルな人間のビデオを生成することは依然として困難な作業であり、現在最も効 … 続きを読む

カテゴリー: cs.CV | Move-in-2D: 2D-Conditioned Human Motion Generation はコメントを受け付けていません

HandsOnVLM: Vision-Language Models for Hand-Object Interaction Prediction

要約 自然言語の形式で高レベルの口語的なタスク仕様が与えられたシーンで、人間の手 … 続きを読む

カテゴリー: cs.CV, cs.LG | HandsOnVLM: Vision-Language Models for Hand-Object Interaction Prediction はコメントを受け付けていません