-
最近の投稿
- BlabberSeg: Real-Time Embedded Open-Vocabulary Aerial Segmentation
- Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks
- Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation
- Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation
- RPCBF: Constructing Safety Filters Robust to Model Error and Disturbances via Policy Control Barrier Functions
-
最近のコメント
表示できるコメントはありません。 cs.AI (28260) cs.CL (21356) cs.CR (2207) cs.CV (34912) cs.LG (33009) cs.RO (16270) cs.SY (2503) eess.IV (4251) eess.SY (2497) stat.ML (4424)
月別アーカイブ: 2024年6月
Evaluating Task-based Effectiveness of MLLMs on Charts
要約 このペーパーでは、GPT-4V はチャート上の低レベルのデータ分析タスクに … 続きを読む
See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding
要約 ビジョン言語モデル (VLM) は、多くの言語の画像に関するクエリに応答で … 続きを読む
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting
要約 マルチビュー画像からの 3D 再構成は、コンピュータ ビジョンとグラフィッ … 続きを読む
カテゴリー: cs.CV
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting はコメントを受け付けていません
Lightweight Model Pre-training via Language Guided Knowledge Distillation
要約 この論文では、多くのモバイル デバイスにとって不可欠な、小規模モデルの事前 … 続きを読む
カテゴリー: cs.CV
Lightweight Model Pre-training via Language Guided Knowledge Distillation はコメントを受け付けていません
A First Physical-World Trajectory Prediction Attack via LiDAR-induced Deceptions in Autonomous Driving
要約 軌道予測は、過去の軌道に基づいて近くのエージェントの動きを予測します。 自 … 続きを読む
OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations
要約 深度補完は、画像と疎な深度マップを入力として与えられて、密な深度マップを生 … 続きを読む
カテゴリー: cs.CV
OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations はコメントを受け付けていません
Latent Denoising Diffusion GAN: Faster sampling, Higher image quality
要約 拡散モデルは、高忠実度で多様な画像を生成するための強力なソリューションとし … 続きを読む
カテゴリー: cs.CV
Latent Denoising Diffusion GAN: Faster sampling, Higher image quality はコメントを受け付けていません
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs
要約 このペーパーでは、ビデオおよびオーディオ指向のタスクにおける時空間モデリン … 続きを読む
Novel Fundus Image Preprocessing for Retcam Images to Improve Deep Learning Classification of Retinopathy of Prematurity
要約 未熟児網膜症(ROP)は、目の網膜が損傷するため、未熟児で生まれた赤ちゃん … 続きを読む
Correspondence Free Multivector Cloud Registration using Conformal Geometric Algebra
要約 我々は、等角幾何代数における対応自由マルチベクトルクラウド登録の問題に対処 … 続きを読む
カテゴリー: cs.CV
Correspondence Free Multivector Cloud Registration using Conformal Geometric Algebra はコメントを受け付けていません