cs.CV」カテゴリーアーカイブ

Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models

要約 特定の医療スキャンで正確な病理学的領域を局在することは、従来、大量の境界の … 続きを読む

カテゴリー: cs.CV, cs.LG | Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models はコメントを受け付けていません

CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization

要約 3D歯科モデルでの解剖学的ランドマークを特定することは、矯正治療に不可欠で … 続きを読む

カテゴリー: cs.CV | CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization はコメントを受け付けていません

Boosting Weak Positives for Text Based Person Search

要約 大規模なビジョン言語モデルは、クロスモーダルオブジェクトの検索に革命をもた … 続きを読む

カテゴリー: cs.CV, cs.LG | Boosting Weak Positives for Text Based Person Search はコメントを受け付けていません

Efficient Interactive 3D Multi-Object Removal

要約 オブジェクトの削除は、3Dシーンの理解にとって非常に重要であり、コンテンツ … 続きを読む

カテゴリー: cs.CV | Efficient Interactive 3D Multi-Object Removal はコメントを受け付けていません

ContourFormer:Real-Time Contour-Based End-to-End Instance Segmentation Transformer

要約 このペーパーでは、リアルタイムの輪郭ベースのインスタンスセグメンテーション … 続きを読む

カテゴリー: cs.AI, cs.CV | ContourFormer:Real-Time Contour-Based End-to-End Instance Segmentation Transformer はコメントを受け付けていません

Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty

要約 知覚ベースのナビゲーションシステムは、従来の深度ベースのナビゲーションスキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, cs.SY, eess.SY | Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty はコメントを受け付けていません

Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey

要約 マルチモーダルビジョン言語モデル(VLM)は、コンピュータービジョンと自然 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey はコメントを受け付けていません

Deciphering the Definition of Adversarial Robustness for post-hoc OOD Detectors

要約 分散除外(OOD)入力の検出は、実際のシナリオに深い学習モデルを安全に展開 … 続きを読む

カテゴリー: cs.CR, cs.CV | Deciphering the Definition of Adversarial Robustness for post-hoc OOD Detectors はコメントを受け付けていません

When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding

要約 既存のコーデックは、固有の冗長性を排除して、圧縮のためのコンパクトな表現を … 続きを読む

カテゴリー: cs.CV, cs.MM | When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding はコメントを受け付けていません

SIGN: A Statistically-Informed Gaze Network for Gaze Time Prediction

要約 画像上の総視線時間を予測するために、統計的に情報に基づいた視線ネットワーク … 続きを読む

カテゴリー: cs.CV, stat.AP | SIGN: A Statistically-Informed Gaze Network for Gaze Time Prediction はコメントを受け付けていません