-
最近の投稿
- Human-Robot Dialogue Annotation for Multi-Modal Common Ground
- Anticipatory Planning for Performant Long-Lived Robot in Large-Scale Home-Like Environments
- SCOUT: A Situated and Multi-Modal Human-Robot Dialogue Corpus
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
- ForestAlign: Automatic Forest Structure-based Alignment for Multi-view TLS and ALS Point Clouds
-
最近のコメント
表示できるコメントはありません。 cs.AI (29925) cs.CL (22599) cs.CR (2321) cs.CV (36300) cs.LG (34746) cs.RO (17366) cs.SY (2670) eess.IV (4416) eess.SY (2664) stat.ML (4635)
「I.4」カテゴリーアーカイブ
Learning Adversarial Semantic Embeddings for Zero-Shot Recognition in Open Worlds
要約 ゼロショット学習 (ZSL) は、トレーニング中に提示される副意味情報のみ … 続きを読む
Why current rain denoising models fail on CycleGAN created rain images in autonomous driving
要約 車両内の自律エージェントの主なタスクの 1 つは、その環境を正しく認識する … 続きを読む
Probing the Role of Positional Information in Vision-Language Models
要約 ほとんどの視覚言語モデル (VL) では、画像内のオブジェクトに関する位置 … 続きを読む
NeRF: Neural Radiance Field in 3D Vision, A Comprehensive Review
要約 タイトル:NeRF:3Dビジョンにおけるニューラル輝度場-総合的なレビュー … 続きを読む
Unpaired Quad-Path Cycle Consistent Adversarial Networks for Single Image Defogging
要約 【タイトル】 ペアリングされていないQuad-Path Cycle Con … 続きを読む
A Deep Registration Method for Accurate Quantification of Joint Space Narrowing Progression in Rheumatoid Arthritis
要約 タイトル:リウマチ性関節炎における関節スペース変窄の進行の正確な定量化のた … 続きを読む
Multi-scale Hierarchical Vision Transformer with Cascaded Attention Decoding for Medical Image Segmentation
要約 トランスフォーマーは、医用画像のセグメンテーションで大きな成功を収めていま … 続きを読む
UMFuse: Unified Multi View Fusion for Human Editing applications
要約 多数のポーズガイド付きの人間による編集方法が、その広範な実用的なアプリケー … 続きを読む
Backdoor Attacks Against Deep Image Compression via Adaptive Frequency Trigger
要約 最近の深層学習ベースの圧縮方法は、従来のアプローチと比較して優れたパフォー … 続きを読む