-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models
要約 拡散モデルに基づいて AI によって生成されたコンテンツが広く使用されてい … 続きを読む
Attack-Resilient Image Watermarking Using Stable Diffusion
要約 画像に透かしを入れることは、画像の出所を追跡し、所有権を証明するために重要 … 続きを読む
LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition
要約 グループ アクティビティ認識 (GAR) は、マルチエージェント インタラ … 続きを読む
カテゴリー: cs.CV
LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition はコメントを受け付けていません
LAMA: Stable Dual-Domain Deep Reconstruction For Sparse-View CT
要約 逆の問題は、多くのアプリケーション、特に断層撮影イメージングで発生します。 … 続きを読む
Zero-Shot Action Recognition in Surveillance Videos
要約 公共空間での監視需要の高まりは、人的資源の不足により重大な課題を引き起こし … 続きを読む
Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences
要約 緑内障進行予測のための縦断的データセットの利用は、早期の治療介入をサポート … 続きを読む
カテゴリー: cs.CV
Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences はコメントを受け付けていません
DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation
要約 画像生成の分野では、追加のテキスト指示を使用して視覚的なプロンプトからカス … 続きを読む
カテゴリー: cs.CV
DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation はコメントを受け付けていません
Unique3D: High-Quality and Efficient 3D Mesh Generation from a Single Image
要約 この研究では、単一ビュー画像から高品質の 3D メッシュを効率的に生成する … 続きを読む
Enhancing Learned Image Compression via Cross Window-based Attention
要約 近年、学習された画像圧縮方法は、従来の画像圧縮方法と比較して優れたレート歪 … 続きを読む
Synthetica: Large Scale Synthetic Data for Robot Perception
要約 ビジョンベースの物体検出器は、環境内の物体の位置特定に関する貴重な情報を提 … 続きを読む