月別アーカイブ: 2024年5月

CLIP-Guided Source-Free Object Detection in Aerial Images

要約 航空画像の視覚的表現は地理的位置、時間、気象条件などの要因に基づいて大幅に … 続きを読む

カテゴリー: cs.CV | CLIP-Guided Source-Free Object Detection in Aerial Images はコメントを受け付けていません

Federated and Transfer Learning for Cancer Detection Based on Image Analysis

要約 このレビュー記事では、画像解析に基づくがん検出における連合学習 (FL) … 続きを読む

カテゴリー: cs.CV | Federated and Transfer Learning for Cancer Detection Based on Image Analysis はコメントを受け付けていません

Enhancing Multimodal Large Language Models with Vision Detection Models: An Empirical Study

要約 テキストと画像のモダリティを統合するマルチモーダル大規模言語モデル (ML … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Multimodal Large Language Models with Vision Detection Models: An Empirical Study はコメントを受け付けていません

A Multimodal Dangerous State Recognition and Early Warning System for Elderly with Intermittent Dementia

要約 中国における高齢化の深刻化により、行方不明の高齢者が増加するという社会問題 … 続きを読む

カテゴリー: cs.CV | A Multimodal Dangerous State Recognition and Early Warning System for Elderly with Intermittent Dementia はコメントを受け付けていません

OpenDAS: Domain Adaptation for Open-Vocabulary Segmentation

要約 ビジョン言語モデル (VLM) の出現により、画像の理解がクローズドセット … 続きを読む

カテゴリー: cs.CV | OpenDAS: Domain Adaptation for Open-Vocabulary Segmentation はコメントを受け付けていません

Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals

要約 ますます優れた機能を備えた大規模言語モデル (LLM) の出現に伴い、視覚 … 続きを読む

カテゴリー: cs.CV | Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals はコメントを受け付けていません

MotionDreamer: Zero-Shot 3D Mesh Animation from Video Diffusion Models

要約 アニメーション技術は、デジタル 3D 世界とキャラクターに命を吹き込みます … 続きを読む

カテゴリー: cs.CV, cs.GR | MotionDreamer: Zero-Shot 3D Mesh Animation from Video Diffusion Models はコメントを受け付けていません

Landslide mapping from Sentinel-2 imagery through change detection

要約 地滑りは、最も重大かつ破壊的な地災害の 1 つです。 人間の活動や居住地が … 続きを読む

カテゴリー: cs.CV, eess.IV | Landslide mapping from Sentinel-2 imagery through change detection はコメントを受け付けていません

Transformers and Slot Encoding for Sample Efficient Physical World Modelling

要約 世界モデリング、つまり世界の進化を予測するために世界を支配する規則の表現を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Transformers and Slot Encoding for Sample Efficient Physical World Modelling はコメントを受け付けていません

SPARE: Symmetrized Point-to-Plane Distance for Robust Non-Rigid Registration

要約 非剛体位置合わせのための既存の最適化ベースの方法は、通常、ソース表面とター … 続きを読む

カテゴリー: cs.CV, cs.GR | SPARE: Symmetrized Point-to-Plane Distance for Robust Non-Rigid Registration はコメントを受け付けていません