-
最近の投稿
- VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
- GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography
- ASHiTA: Automatic Scene-grounded HIerarchical Task Analysis
- Automated Fabrication of Magnetic Soft Microrobots
- Comparing Self-Disclosure Themes and Semantics to a Human, a Robot, and a Disembodied Agent
-
最近のコメント
表示できるコメントはありません。 cs.AI (36371) cs.CL (27525) cs.CV (42192) cs.HC (2771) cs.LG (41353) cs.RO (21500) cs.SY (3255) eess.IV (4938) eess.SY (3249) stat.ML (5411)
「I.4」カテゴリーアーカイブ
Probing the Role of Positional Information in Vision-Language Models
要約 ほとんどの視覚言語モデル (VL) では、画像内のオブジェクトに関する位置 … 続きを読む
NeRF: Neural Radiance Field in 3D Vision, A Comprehensive Review
要約 タイトル:NeRF:3Dビジョンにおけるニューラル輝度場-総合的なレビュー … 続きを読む
Unpaired Quad-Path Cycle Consistent Adversarial Networks for Single Image Defogging
要約 【タイトル】 ペアリングされていないQuad-Path Cycle Con … 続きを読む
A Deep Registration Method for Accurate Quantification of Joint Space Narrowing Progression in Rheumatoid Arthritis
要約 タイトル:リウマチ性関節炎における関節スペース変窄の進行の正確な定量化のた … 続きを読む
Multi-scale Hierarchical Vision Transformer with Cascaded Attention Decoding for Medical Image Segmentation
要約 トランスフォーマーは、医用画像のセグメンテーションで大きな成功を収めていま … 続きを読む
UMFuse: Unified Multi View Fusion for Human Editing applications
要約 多数のポーズガイド付きの人間による編集方法が、その広範な実用的なアプリケー … 続きを読む
Backdoor Attacks Against Deep Image Compression via Adaptive Frequency Trigger
要約 最近の深層学習ベースの圧縮方法は、従来のアプローチと比較して優れたパフォー … 続きを読む
Deep Vision in Analysis and Recognition of Radar Data: Achievements, Advancements and Challenges
要約 レーダは、降水ナウキャスティングなど、効果的な予測のためのエコー情報を取得 … 続きを読む
Medical Face Masks and Emotion Recognition from the Body: Insights from a Deep Learning Perspective
要約 COVID-19 パンデミックは間違いなく基準を変え、私たちの生活、特に社 … 続きを読む
Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose Regression and Odometry-aided Absolute Pose Regression
要約 視覚慣性ローカリゼーションは、仮想現実、自動運転車、航空機などのコンピュー … 続きを読む