cs.CV」カテゴリーアーカイブ

Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance

要約 世界には多様な素材が豊富にあり、それぞれが独特の表面外観を持ち、それらの特 … 続きを読む

カテゴリー: cs.CV | Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance はコメントを受け付けていません

Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring

要約 この研究では、時空間物体検出モデルの開発を通じて、UAV カメラを使用した … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring はコメントを受け付けていません

LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning

要約 モデルの規模が急速に拡大したため、微調整のために大量の計算リソースが必要に … 続きを読む

カテゴリー: cs.CV | LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning はコメントを受け付けていません

Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything

要約 この研究は、効果的な病理学的画像分析のための教師あり学習を超えた新しいアプ … 続きを読む

カテゴリー: cs.CV | Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything はコメントを受け付けていません

Granular Privacy Control for Geolocation with Vision Language Models

要約 ビジョン言語モデル (VLM) は、情報を求める質問に答える機能が急速に進 … 続きを読む

カテゴリー: cs.CL, cs.CV | Granular Privacy Control for Geolocation with Vision Language Models はコメントを受け付けていません

Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition

要約 教師なしドメイン適応 (UDA) は、特にトレーニング データとテスト デ … 続きを読む

カテゴリー: cs.CV | Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition はコメントを受け付けていません

Learning Action and Reasoning-Centric Image Editing from Videos and Simulations

要約 画像編集モデルは、オブジェクトの置換、属性やスタイルの変更、アクションや動 … 続きを読む

カテゴリー: cs.CV | Learning Action and Reasoning-Centric Image Editing from Videos and Simulations はコメントを受け付けていません

Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts?

要約 少量の視覚データから新しいオブジェクトについて学習し、新しいシナリオにおけ … 続きを読む

カテゴリー: cs.CV | Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts? はコメントを受け付けていません

ActionCOMET: A Zero-shot Approach to Learn Image-specific Commonsense Concepts about Actions

要約 人間は、他の人間が実行しているさまざまな行動を(物理的に、またはビデオや画 … 続きを読む

カテゴリー: cs.CV | ActionCOMET: A Zero-shot Approach to Learn Image-specific Commonsense Concepts about Actions はコメントを受け付けていません

DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition

要約 災害評価における航空画像処理のための無人航空機 (UAV) と人工知能 ( … 続きを読む

カテゴリー: cs.CV | DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition はコメントを受け付けていません