-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Imperceptible Protection against Style Imitation from Diffusion Models
要約 拡散モデルの最近の進歩により、画像生成の忠実度は大幅に向上しましたが、著作 … 続きを読む
カテゴリー: cs.CV
Imperceptible Protection against Style Imitation from Diffusion Models はコメントを受け付けていません
What is YOLOv8: An In-Depth Exploration of the Internal Features of the Next-Generation Object Detector
要約 この調査では、YOLOv8 オブジェクト検出モデルの詳細な分析を示し、その … 続きを読む
カテゴリー: cs.CV
What is YOLOv8: An In-Depth Exploration of the Internal Features of the Next-Generation Object Detector はコメントを受け付けていません
Provable Probabilistic Imaging using Score-Based Generative Priors
要約 高品質の画像を推定しながらその不確実性を定量化することは、不正設定逆問 … 続きを読む
microYOLO: Towards Single-Shot Object Detection on Microcontrollers
要約 この進行中の論文では、YOLO を使用したマイクロコントローラーでのシング … 続きを読む
GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model
要約 自動運転トレーニングには、さまざまな交通状況、気象シナリオ、道路の種類を含 … 続きを読む
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation
要約 このペーパーでは、オーディオおよび言語参照ビデオ オブジェクト セグメンテ … 続きを読む
カテゴリー: cs.CV
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation はコメントを受け付けていません
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation
要約 大規模な MLLM (l-MLLM) から知識を抽出することで、小規模なマ … 続きを読む
カテゴリー: cs.CV
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation はコメントを受け付けていません
SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors
要約 3D 臨床医療画像の正確なセグメンテーションは、脊椎疾患の診断と治療におい … 続きを読む
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data
要約 複数の部位とスキャナーからの神経画像データセットを組み合わせると、統計的検 … 続きを読む
カテゴリー: cs.CV
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data はコメントを受け付けていません
Gen-Swarms: Adapting Deep Generative Models to Swarms of Drones
要約 Gen-Swarms は、ディープ生成モデルの機能を活用し、リアクティブ … 続きを読む