「cs.CV」カテゴリーアーカイブ

Vision-Language Models for Edge Networks: A Comprehensive Survey

投稿日: 2025年6月16日作成者: jarxiv

要約 Vision Large Language Models（VLMS）は、視 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation

投稿日: 2025年6月16日作成者: jarxiv

要約複雑な活動における人間のスキルレベルを評価することは、スポーツ、リハビリテ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment

投稿日: 2025年6月16日作成者: jarxiv

要約自動化されたスポーツスキル評価には、専門家を初心者のパフォーマンスと区別す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Quizzard@INOVA Challenge 2025 — Track A: Plug-and-Play Technique in Interleaved Multi-Image Model

投稿日: 2025年6月16日作成者: jarxiv

要約このペーパーでは、2つの主要な目的について説明します。第一に、マルチイメ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM | コメントを受け付けていません

AgriPotential: A Novel Multi-Spectral and Multi-Temporal Remote Sensing Dataset for Agricultural Potentials

投稿日: 2025年6月16日作成者: jarxiv

要約リモートセンシングは、大規模な地球監視と土地管理のための重要なツールとして … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Exploring the Effectiveness of Deep Features from Domain-Specific Foundation Models in Retinal Image Synthesis

投稿日: 2025年6月16日作成者: jarxiv

要約医療イメージングにおけるニューラルネットワークモデルの採用は、厳格なプライ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models

投稿日: 2025年6月16日作成者: jarxiv

要約このホワイトペーパーでは、Sentinel-2レベル-2A画像の12個すべ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

MambaVSR: Content-Aware Scanning State Space Model for Video Super-Resolution

投稿日: 2025年6月16日作成者: jarxiv

要約ビデオスーパー解像度（VSR）は、計算効率を維持しながら、不整合フレーム全 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection

投稿日: 2025年6月16日作成者: jarxiv

要約異常検出は、異常の定義、異常タイプの多様性（局所的および世界的な欠陥など） … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

AgentSense: Virtual Sensor Data Generation Using LLM Agent in Simulated Home Environments

投稿日: 2025年6月16日作成者: jarxiv

要約堅牢で一般化可能なスマートホームベースのヒューマンアクティビティ認識（HA … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Vision-Language Models for Edge Networks: A Comprehensive Survey

SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation

PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment

Quizzard@INOVA Challenge 2025 — Track A: Plug-and-Play Technique in Interleaved Multi-Image Model

AgriPotential: A Novel Multi-Spectral and Multi-Temporal Remote Sensing Dataset for Agricultural Potentials

Exploring the Effectiveness of Deep Features from Domain-Specific Foundation Models in Retinal Image Synthesis

DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models

MambaVSR: Content-Aware Scanning State Space Model for Video Super-Resolution

CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection

AgentSense: Virtual Sensor Data Generation Using LLM Agent in Simulated Home Environments

最近の投稿

最近のコメント

アーカイブ

カテゴリー