-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Sim2Real in endoscopy segmentation with a novel structure aware image translation
要約 内視鏡画像における解剖学的ランドマークの自動セグメンテーションは、医師や外 … 続きを読む
Grasp the Graph (GtG) 2.0: Ensemble of GNNs for High-Precision Grasp Pose Detection in Clutter
要約 雑然とした実環境における把持ポーズ検出は、ノイズが多く不完全な感覚データと … 続きを読む
Multimodal Deep Learning for Stroke Prediction and Detection using Retinal Imaging and Clinical Data
要約 脳卒中は公衆衛生上の大きな問題であり、世界中で数百万人が罹患している。ディ … 続きを読む
カテゴリー: cs.CV
Multimodal Deep Learning for Stroke Prediction and Detection using Retinal Imaging and Clinical Data はコメントを受け付けていません
Enhancing person re-identification via Uncertainty Feature Fusion Method and Auto-weighted Measure Combination
要約 人物の再同定(Re-ID)は、監視システムにおいて、異なるカメラビュー間で … 続きを読む
カテゴリー: cs.CV
Enhancing person re-identification via Uncertainty Feature Fusion Method and Auto-weighted Measure Combination はコメントを受け付けていません
Active Data Curation Effectively Distills Large-Scale Multimodal Models
要約 知識蒸留(KD)は、大規模なモデルをより小さなモデルに圧縮するためのデファ … 続きを読む
Dance of Fireworks: An Interactive Broadcast Gymnastics Training System Based on Pose Estimation
要約 本研究では、ラジオ体操への取り組みを強化することで、座りっぱなしの健康リス … 続きを読む
カテゴリー: cs.CV
Dance of Fireworks: An Interactive Broadcast Gymnastics Training System Based on Pose Estimation はコメントを受け付けていません
Structure Causal Models and LLMs Integration in Medical Visual Question Answering
要約 医療ビジュアル質問応答(Medical Visual Question A … 続きを読む
カテゴリー: cs.CV
Structure Causal Models and LLMs Integration in Medical Visual Question Answering はコメントを受け付けていません
Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery
要約 本研究では、ロバストな単眼奥行きスケール復元法を提案する。単眼的奥行き推定 … 続きを読む
カテゴリー: cs.CV
Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery はコメントを受け付けていません
Multi-View Learning with Context-Guided Receptance for Image Denoising
要約 画像ノイズ除去は、写真撮影や自動運転などの低レベル視覚アプリケーションにお … 続きを読む
A Rate-Quality Model for Learned Video Coding
要約 学習型ビデオ符号化(LVC)は近年、優れた符号化性能を達成している。本論文 … 続きを読む
カテゴリー: cs.CV
A Rate-Quality Model for Learned Video Coding はコメントを受け付けていません