-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Visual Style Prompt Learning Using Diffusion Models for Blind Face Restoration
要約 ブラインドフェイス復元は、さまざまな未確認の劣化源から高品質の顔画像を復元 … 続きを読む
E2EDiff: Direct Mapping from Noise to Data for Enhanced Diffusion Models
要約 拡散モデルは、生成モデリングの強力なフレームワークとして登場し、さまざまな … 続きを読む
カテゴリー: cs.CV
E2EDiff: Direct Mapping from Noise to Data for Enhanced Diffusion Models はコメントを受け付けていません
VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation
要約 我々は、視覚生成モデル (画像生成とビデオ生成の両方) を人間の好みに合わ … 続きを読む
カテゴリー: cs.CV
VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation はコメントを受け付けていません
Varformer: Adapting VAR’s Generative Prior for Image Restoration
要約 広範な高品質データセットでトレーニングされた生成モデルは、きれいな画像の構 … 続きを読む
カテゴリー: cs.CV
Varformer: Adapting VAR’s Generative Prior for Image Restoration はコメントを受け付けていません
Edicho: Consistent Image Editing in the Wild
要約 ニーズが実証されているため、実際の画像全体で一貫した編集を行うことは、オブ … 続きを読む
カテゴリー: cs.CV
Edicho: Consistent Image Editing in the Wild はコメントを受け付けていません
Vinci: A Real-time Embodied Smart Assistant based on Egocentric Vision-Language Model
要約 私たちは、自己中心的な視覚言語モデルに基づいて構築されたリアルタイムの具体 … 続きを読む
カテゴリー: cs.CV
Vinci: A Real-time Embodied Smart Assistant based on Egocentric Vision-Language Model はコメントを受け付けていません
Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation
要約 この研究では、オブジェクト レベルとシーン レベルの両方で数秒でテキストか … 続きを読む
カテゴリー: cs.CV
Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation はコメントを受け付けていません
What Makes for a Good Stereoscopic Image?
要約 仮想現実 (VR) ヘッドセットの急速な進歩により、没入型で快適な 3D … 続きを読む
カテゴリー: cs.CV
What Makes for a Good Stereoscopic Image? はコメントを受け付けていません
A Large-Scale Study on Video Action Dataset Condensation
要約 データセットの圧縮は、画像領域で大幅に進歩しました。 画像とは異なり、ビデ … 続きを読む
カテゴリー: cs.CV
A Large-Scale Study on Video Action Dataset Condensation はコメントを受け付けていません
Action-Agnostic Point-Level Supervision for Temporal Action Detection
要約 軽く注釈を付けたデータセットで正確なアクションインスタンスの検出を実現する … 続きを読む