-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2022年11月
RankDNN: Learning to Rank for Few-shot Learning
要約 このホワイト ペーパーでは、画像検索の関連性ランキングをバイナリ ランキン … 続きを読む
カテゴリー: cs.CV
RankDNN: Learning to Rank for Few-shot Learning はコメントを受け付けていません
Unsupervised Superpixel Generation using Edge-Sparse Embedding
要約 色や空間位置などの特徴に関するピクセルの類似性に基づいてイメージをスーパー … 続きを読む
カテゴリー: cs.CV
Unsupervised Superpixel Generation using Edge-Sparse Embedding はコメントを受け付けていません
High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization
要約 入力画像の特定の詳細を保持しながら、フォトリアリスティックな斬新なビューを … 続きを読む
カテゴリー: cs.CV
High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization はコメントを受け付けていません
Topologically faithful image segmentation via induced matching of persistence barcodes
要約 画像セグメンテーションは、ニューラル ネットワークがテクノロジーの多くの面 … 続きを読む
Pedestrian Spatio-Temporal Information Fusion For Video Anomaly Detection
要約 現在のビデオ異常検出では時間情報を完全に使用できず、通常の行動の多様性を無 … 続きを読む
カテゴリー: cs.CV
Pedestrian Spatio-Temporal Information Fusion For Video Anomaly Detection はコメントを受け付けていません
Hierachical Delta-Attention Method for Multimodal Fusion
要約 視覚と言語学; 主な入力モダリティは、顔の表情、発話パターン、および発話さ … 続きを読む
Conditional Progressive Generative Adversarial Network for satellite image generation
要約 欠落したピクセルを現実的に置き換えることができる機械学習アルゴリズムのおか … 続きを読む
Tuning-free Plug-and-Play Hyperspectral Image Deconvolution with Deep Priors
要約 デコンボリューションは、取得デバイスによって生成されるハイパースペクトル画 … 続きを読む
NeuralMPS: Non-Lambertian Multispectral Photometric Stereo via Spectral Reflectance Decomposition
要約 マルチスペクトル フォトメトリック ステレオ (MPS) は、マルチスペク … 続きを読む
カテゴリー: cs.CV
NeuralMPS: Non-Lambertian Multispectral Photometric Stereo via Spectral Reflectance Decomposition はコメントを受け付けていません
DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning
要約 ゼロ ショット学習 (ZSL) は、トレーニング中にサンプルが一度も出現し … 続きを読む