-
最近の投稿
- 3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40395) cs.LG (39550) cs.RO (20192) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2022年8月
DeepSolar tracker: towards unsupervised assessment with open-source data of the accuracy of deep learning-based distributed PV mapping
要約 太陽光発電 (PV) エネルギーは急速に成長しており、エネルギー危機を緩和 … 続きを読む
Compound virtual screening by learning-to-rank with gradient boosting decision tree and enrichment-based cumulative gain
要約 Learning-to-rank は、情報検索で広く使用されている機械学習 … 続きを読む
Plant Species Recognition with Optimized 3D Polynomial Neural Networks and Variably Overlapping Time-Coherent Sliding Window
要約 最近、EAGL-I システムが開発され、農家や研究者が農業で AI 主導の … 続きを読む
SphereDepth: Panorama Depth Estimation from Spherical Domain
要約 パノラマ画像は、周囲環境の完全な情報を同時に示すことができ、仮想観光、ゲー … 続きを読む
カテゴリー: cs.CV
SphereDepth: Panorama Depth Estimation from Spherical Domain はコメントを受け付けていません
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation
要約 以前の音声駆動の話し顔生成方法は、合成ビデオの視覚的品質とリップシンク品質 … 続きを読む
カテゴリー: cs.CV
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation はコメントを受け付けていません
CounTR: Transformer-based Generalised Visual Counting
要約 この論文では、任意の数の「見本」、つまりゼロショットまたは少数ショットのカ … 続きを読む
カテゴリー: cs.CV
CounTR: Transformer-based Generalised Visual Counting はコメントを受け付けていません
Open-Set Semi-Supervised Object Detection
要約 半教師ありオブジェクト検出 (SSOD) の最近の開発では、ラベルのないデ … 続きを読む
Effective Image Tampering Localization via Semantic Segmentation Network
要約 強力な画像編集ツールが広く使用されるようになったことで、画像の改ざんが容易 … 続きを読む
カテゴリー: cs.CV
Effective Image Tampering Localization via Semantic Segmentation Network はコメントを受け付けていません
Frido: Feature Pyramid Diffusion for Complex Scene Image Synthesis
要約 拡散モデル (DM) は、高品質の画像合成の大きな可能性を示しています。 … 続きを読む
Uncertainty Guided Depth Fusion for Spike Camera
要約 深度推定は、自動運転などのさまざまな重要な現実世界のアプリケーションに不可 … 続きを読む