-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DepthMatch: Semi-Supervised RGB-D Scene Parsing through Depth-Guided Regularization
要約 RGB-Dシーンの解析方法は、環境のセマンティックと幾何学的特徴の両方を効 … 続きを読む
カテゴリー: cs.CV
DepthMatch: Semi-Supervised RGB-D Scene Parsing through Depth-Guided Regularization はコメントを受け付けていません
NFIG: Autoregressive Image Generation with Next-Frequency Prediction
要約 自己回帰モデルは、自然言語処理において有望な結果を達成しています。 ただし … 続きを読む
Efficient Training-Free High-Resolution Synthesis with Energy Rectification in Diffusion Models
要約 拡散モデルは、さまざまな視覚生成タスクにわたって顕著な進歩を遂げています。 … 続きを読む
Data-Free Class-Incremental Gesture Recognition with Prototype-Guided Pseudo Feature Replay
要約 ジェスチャー認識は、コンピュータービジョンの分野における重要な研究分野です … 続きを読む
カテゴリー: cs.CV
Data-Free Class-Incremental Gesture Recognition with Prototype-Guided Pseudo Feature Replay はコメントを受け付けていません
Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion
要約 拡散モデルは、テキストからイメージの生成の主流のアーキテクチャとなっており … 続きを読む
PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation
要約 コンピューティングダンス生成は、特にコヒーレントで表現力豊かな長いダンスシ … 続きを読む
カテゴリー: cs.CV
PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation はコメントを受け付けていません
M3DHMR: Monocular 3D Hand Mesh Recovery
要約 単眼3Dハンドメッシュの回復は、手の自由度、2Dから3Dのあいまいさ、自己 … 続きを読む
カテゴリー: cs.CV
M3DHMR: Monocular 3D Hand Mesh Recovery はコメントを受け付けていません
Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting
要約 時系列予測における最近の進歩により、テキストまたはビジョンモダリティを使用 … 続きを読む
VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion
要約 レッグロボットの移動における最近の成功は、強化学習と物理シミュレーターの統 … 続きを読む
NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation
要約 強化学習(RL)の最近の進歩により、視覚言語モデル(VLM)の推論能力が強 … 続きを読む
カテゴリー: cs.CV
NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation はコメントを受け付けていません