月別アーカイブ: 2024年2月

ScreenAI: A Vision-Language Model for UI and Infographics Understanding

投稿日: 2024年2月20日作成者: jarxiv

要約画面ユーザーインターフェイス (UI) とインフォグラフィックスは、同様 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

投稿日: 2024年2月20日作成者: jarxiv

要約都市環境における自動運転の主なハードルは、困難な道路状況や繊細な人間の行動 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Regularization by denoising: Bayesian model and Langevin-within-split Gibbs sampling

投稿日: 2024年2月20日作成者: jarxiv

要約この論文では、ノイズ除去による正則化 (RED) パラダイムに確率論的に対 … 続きを読む →

カテゴリー: cs.CV, cs.LG, stat.ML | コメントを受け付けていません

UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking

投稿日: 2024年2月20日作成者: jarxiv

要約研究コミュニティからの強い関心と物体検出方法の着実な改善により、最近、複数 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Landmark Stereo Dataset for Landmark Recognition and Moving Node Localization in a Non-GPS Battlefield Environment

投稿日: 2024年2月20日作成者: jarxiv

要約この論文では、無線ベースのアンカーノードの代わりにランドマークアンカー … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud

投稿日: 2024年2月20日作成者: jarxiv

要約モバイルの自律性は、動的な環境を正確に認識することに依存しています。した … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

投稿日: 2024年2月20日作成者: jarxiv

要約 OpenFlamingo、LLaVA、GPT-4 などのマルチモーダル基盤 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

FiT: Flexible Vision Transformer for Diffusion Model

投稿日: 2024年2月20日作成者: jarxiv

要約自然は無限に解像度がありません。この現実を踏まえると、拡散トランスフォー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based View Synthesis

投稿日: 2024年2月20日作成者: jarxiv

要約サーフェスベースのビュー合成アルゴリズムは、計算要件が低いため魅力的ですが … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Preferences Evolve And So Should Your Bandits: Bandits with Evolving States for Online Platforms

投稿日: 2024年2月20日作成者: jarxiv

要約我々は、決定論的に進化する状態と観察不可能な状態を考慮しながらバンディット … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年2月

ScreenAI: A Vision-Language Model for UI and Infographics Understanding

DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

Regularization by denoising: Bayesian model and Langevin-within-split Gibbs sampling

UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking

Landmark Stereo Dataset for Landmark Recognition and Moving Node Localization in a Non-GPS Battlefield Environment

RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

FiT: Flexible Vision Transformer for Diffusion Model

Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based View Synthesis

Preferences Evolve And So Should Your Bandits: Bandits with Evolving States for Online Platforms

最近の投稿

最近のコメント

アーカイブ

カテゴリー