-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Conditional GAN for Enhancing Diffusion Models in Efficient and Authentic Global Gesture Generation from Audios
要約 音声による同時ジェスチャー生成は、人間とコンピュータのコミュニケーション、 … 続きを読む
LongVILA: Scaling Long-Context Visual Language Models for Long Videos
要約 ロングコンテクスト機能は、マルチモーダル基礎モデル、特に長時間のビデオ理解 … 続きを読む
FRoundation: Are Foundation Models Ready for Face Recognition?
要約 ファンデーションモデルは主に、非常に多様で大規模なデータセットに対して、教 … 続きを読む
カテゴリー: cs.CV
FRoundation: Are Foundation Models Ready for Face Recognition? はコメントを受け付けていません
Improving Generalization in Visual Reasoning via Self-Ensemble
要約 視覚的推論の認知能力には、マルチモーダルな知覚処理と世界に関する常識的・外 … 続きを読む
カテゴリー: cs.CV
Improving Generalization in Visual Reasoning via Self-Ensemble はコメントを受け付けていません
Video Diffusion Models are Training-free Motion Interpreter and Controller
要約 ビデオ生成は主に、フレームをまたがる本物のカスタマイズされたモーションをモ … 続きを読む
カテゴリー: cs.CV
Video Diffusion Models are Training-free Motion Interpreter and Controller はコメントを受け付けていません
On-Air Deep Learning Integrated Semantic Inference Models for Enhanced Earth Observation Satellite Networks
要約 地球観測(EO)システムは、地図作成、災害監視、資源管理にとって極めて重要 … 続きを読む
Kuro Siwo: 33 billion $m^2$ under the water. A global multi-temporal satellite dataset for rapid flood mapping
要約 気候変動によって悪化した世界の洪水は、人命、インフラ、環境に深刻な脅威をも … 続きを読む
ConvBKI: Real-Time Probabilistic Semantic Mapping Network with Quantifiable Uncertainty
要約 本論文では、不確実な環境におけるリアルタイムの{color{black}( … 続きを読む
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video
要約 弱教師付きビデオオブジェクトセグメンテーション(WSVOS)は、オブジェク … 続きを読む
カテゴリー: cs.CV
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video はコメントを受け付けていません
Autoregressive Image Generation without Vector Quantization
要約 従来の常識では、画像生成のための自己回帰モデルは一般的にベクトル化されたト … 続きを読む
カテゴリー: cs.CV
Autoregressive Image Generation without Vector Quantization はコメントを受け付けていません