-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Estimating Body and Hand Motion in an Ego-sensed World
要約 ヘッドマウントデバイスから人間の動作を推定するシステム EgoAllo を … 続きを読む
BanglishRev: A Large-Scale Bangla-English and Code-mixed Dataset of Product Reviews in E-Commerce
要約 この研究では、BanglishRev データセットを紹介します。これは、英 … 続きを読む
Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild
要約 実際の動的表情認識 (DFER) は、感情に関連した表情を認識する際に大き … 続きを読む
Locate n’ Rotate: Two-stage Openable Part Detection with Foundation Model Priors
要約 多関節オブジェクトの開閉可能な部分を検出することは、引き出しを引き出すなど … 続きを読む
カテゴリー: cs.CV
Locate n’ Rotate: Two-stage Openable Part Detection with Foundation Model Priors はコメントを受け付けていません
ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection
要約 顔ランドマーク検出 (FLD) は大幅な進歩を遂げていますが、既存の FL … 続きを読む
NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment
要約 単眼内視鏡ビデオからの同時位置特定とマッピング (SLAM) により、自律 … 続きを読む
カテゴリー: cs.CV
NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment はコメントを受け付けていません
Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration
要約 視覚言語モデルの高速化に関する最近の研究では、視覚情報が高度に圧縮されてい … 続きを読む
カテゴリー: cs.CV
Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration はコメントを受け付けていません
Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures
要約 スパース ビュー RGB 入力からのリアルタイム フリー ビュー ヒューマ … 続きを読む
カテゴリー: cs.CV
Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures はコメントを受け付けていません
Move-in-2D: 2D-Conditioned Human Motion Generation
要約 リアルな人間のビデオを生成することは依然として困難な作業であり、現在最も効 … 続きを読む
カテゴリー: cs.CV
Move-in-2D: 2D-Conditioned Human Motion Generation はコメントを受け付けていません
HandsOnVLM: Vision-Language Models for Hand-Object Interaction Prediction
要約 自然言語の形式で高レベルの口語的なタスク仕様が与えられたシーンで、人間の手 … 続きを読む