月別アーカイブ: 2024年6月

Evaluating Task-based Effectiveness of MLLMs on Charts

要約 このペーパーでは、GPT-4V はチャート上の低レベルのデータ分析タスクに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Evaluating Task-based Effectiveness of MLLMs on Charts はコメントを受け付けていません

See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding

要約 ビジョン言語モデル (VLM) は、多くの言語の画像に関するクエリに応答で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding はコメントを受け付けていません

Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting

要約 マルチビュー画像からの 3D 再構成は、コンピュータ ビジョンとグラフィッ … 続きを読む

カテゴリー: cs.CV | Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting はコメントを受け付けていません

Lightweight Model Pre-training via Language Guided Knowledge Distillation

要約 この論文では、多くのモバイル デバイスにとって不可欠な、小規模モデルの事前 … 続きを読む

カテゴリー: cs.CV | Lightweight Model Pre-training via Language Guided Knowledge Distillation はコメントを受け付けていません

A First Physical-World Trajectory Prediction Attack via LiDAR-induced Deceptions in Autonomous Driving

要約 軌道予測は、過去の軌道に基づいて近くのエージェントの動きを予測します。 自 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | A First Physical-World Trajectory Prediction Attack via LiDAR-induced Deceptions in Autonomous Driving はコメントを受け付けていません

OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations

要約 深度補完は、画像と疎な深度マップを入力として与えられて、密な深度マップを生 … 続きを読む

カテゴリー: cs.CV | OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations はコメントを受け付けていません

Latent Denoising Diffusion GAN: Faster sampling, Higher image quality

要約 拡散モデルは、高忠実度で多様な画像を生成するための強力なソリューションとし … 続きを読む

カテゴリー: cs.CV | Latent Denoising Diffusion GAN: Faster sampling, Higher image quality はコメントを受け付けていません

VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs

要約 このペーパーでは、ビデオおよびオーディオ指向のタスクにおける時空間モデリン … 続きを読む

カテゴリー: cs.CL, cs.CV | VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs はコメントを受け付けていません

Novel Fundus Image Preprocessing for Retcam Images to Improve Deep Learning Classification of Retinopathy of Prematurity

要約 未熟児網膜症(ROP)は、目の網膜が損傷するため、未熟児で生まれた赤ちゃん … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.1 | Novel Fundus Image Preprocessing for Retcam Images to Improve Deep Learning Classification of Retinopathy of Prematurity はコメントを受け付けていません

Correspondence Free Multivector Cloud Registration using Conformal Geometric Algebra

要約 我々は、等角幾何代数における対応自由マルチベクトルクラウド登録の問題に対処 … 続きを読む

カテゴリー: cs.CV | Correspondence Free Multivector Cloud Registration using Conformal Geometric Algebra はコメントを受け付けていません