cs.CV」カテゴリーアーカイブ

Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map

要約 古地図は、過去の詳細な地理情報を記録した貴重な資料です。 ただし、これらの … 続きを読む

カテゴリー: cs.CV | Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map はコメントを受け付けていません

Optimal Fiducial Marker Placement for Satellite Proximity Operations Using Observability Gramians

要約 本論文では、オブザーバ衛星との相対近接運用を行う衛星の表面における最適なフ … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY, math.OC | Optimal Fiducial Marker Placement for Satellite Proximity Operations Using Observability Gramians はコメントを受け付けていません

Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory

要約 自律走行(AD)知覚モデルの汎化性を向上させるために、車両は継続的に収集さ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory はコメントを受け付けていません

Cloth-Splatting: 3D Cloth State Estimation from RGB Supervision

要約 RGB画像から布の3次元状態を予測更新フレームワークによって推定する手法、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Cloth-Splatting: 3D Cloth State Estimation from RGB Supervision はコメントを受け付けていません

Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation

要約 このプロジェクトでは、インドネシア語から英語へのマンファ翻訳を自動化するた … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation はコメントを受け付けていません

MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders

要約 視覚エンコーダは視覚言語モデル(VLM)の基本的な構成要素であり、それぞれ … 続きを読む

カテゴリー: cs.AI, cs.CV | MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders はコメントを受け付けていません

Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations

要約 X線による禁止物品の自動検出は、公共の安全にとって不可欠である。既存のディ … 続きを読む

カテゴリー: cs.AI, cs.CV | Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations はコメントを受け付けていません

EventHallusion: Diagnosing Event Hallucinations in Video LLMs

要約 近年、マルチモーダル大規模言語モデル(MLLM)が動画像理解分野で大きな進 … 続きを読む

カテゴリー: cs.CV | EventHallusion: Diagnosing Event Hallucinations in Video LLMs はコメントを受け付けていません

TVBench: Redesigning Video-Language Evaluation

要約 大規模な言語モデルは、視覚モデルと統合されることで、ビデオ理解さえ可能にす … 続きを読む

カテゴリー: cs.CV | TVBench: Redesigning Video-Language Evaluation はコメントを受け付けていません

From Age Estimation to Age-Invariant Face Recognition: Generalized Age Feature Extraction Using Order-Enhanced Contrastive Learning

要約 一般化された年齢特徴抽出は、年齢推定や年齢不変顔認識(AIFR)のような、 … 続きを読む

カテゴリー: cs.CV | From Age Estimation to Age-Invariant Face Recognition: Generalized Age Feature Extraction Using Order-Enhanced Contrastive Learning はコメントを受け付けていません