-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction
要約 スコア蒸留サンプリング (SDS) などの最適化ベースのアプローチは、ゼロ … 続きを読む
カテゴリー: cs.CV
MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction はコメントを受け付けていません
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes
要約 私たちは、視覚的特徴やセマンティック マスクを 2D ビジョン モデルから … 続きを読む
カテゴリー: cs.CV
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes はコメントを受け付けていません
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?
要約 ニューラル ネットワークの量子化は、リソースが限られたデバイスにモデルを展 … 続きを読む
カテゴリー: cs.CV
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models? はコメントを受け付けていません
How Do Training Methods Influence the Utilization of Vision Models?
要約 すべての学習可能なパラメータ (重みなど) がニューラル ネットワークの決 … 続きを読む
An Integrated Deep Learning Model for Skin Cancer Detection Using Hybrid Feature Fusion Technique
要約 皮膚がんは、DNA 損傷によって引き起こされる重篤で死に至る可能性のある病 … 続きを読む
Neural Real-Time Recalibration for Infrared Multi-Camera Systems
要約 現在、赤外線マルチカメラ システムのリアルタイム再キャリブレーションのため … 続きを読む
Deep Implicit Optimization for Robust and Flexible Image Registration
要約 画像レジストレーションにおける深層学習 (DLIR) 手法は、その速度とト … 続きを読む
On Efficient Variants of Segment Anything Model: A Survey
要約 Segment Anything Model (SAM) は、画像セグメン … 続きを読む
カテゴリー: cs.CV
On Efficient Variants of Segment Anything Model: A Survey はコメントを受け付けていません
LEAD: Latent Realignment for Human Motion Diffusion
要約 私たちの目標は、自然言語からリアルな人間の動きを生成することです。 最新の … 続きを読む
CLIP-VAD: Exploiting Vision-Language Models for Voice Activity Detection
要約 音声アクティビティ検出 (VAD) は、人が話しているかどうかを自動的に判 … 続きを読む
カテゴリー: cs.CV
CLIP-VAD: Exploiting Vision-Language Models for Voice Activity Detection はコメントを受け付けていません