cs.CV」カテゴリーアーカイブ

TASTE-Rob: Advancing Video Generation of Task-Oriented Hand-Object Interaction for Generalizable Robotic Manipulation

要約 タスク指向のハンドオブジェクトインタラクションビデオ生成の既存のデータセッ … 続きを読む

カテゴリー: cs.CV, cs.RO | TASTE-Rob: Advancing Video Generation of Task-Oriented Hand-Object Interaction for Generalizable Robotic Manipulation はコメントを受け付けていません

Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method

要約 弱く監視されている暴力検出とは、ビデオレベルのラベルのみを使用してビデオの … 続きを読む

カテゴリー: cs.CV | Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method はコメントを受け付けていません

COIN: Confidence Score-Guided Distillation for Annotation-Free Cell Segmentation

要約 細胞インスタンスセグメンテーション(CIS)は、組織病理学的画像の個々の細 … 続きを読む

カテゴリー: cs.CV | COIN: Confidence Score-Guided Distillation for Annotation-Free Cell Segmentation はコメントを受け付けていません

Multi-modal Vision Pre-training for Medical Image Analysis

要約 自己学習学習は、実際のアプリケーションのトレーニングデータ要件を抑制するこ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Multi-modal Vision Pre-training for Medical Image Analysis はコメントを受け付けていません

Remote Photoplethysmography in Real-World and Extreme Lighting Scenarios

要約 生理学的活動は、顔のイメージングの敏感な変化によって明らかになる可能性があ … 続きを読む

カテゴリー: cs.CV | Remote Photoplethysmography in Real-World and Extreme Lighting Scenarios はコメントを受け付けていません

Visual Adaptive Prompting for Compositional Zero-Shot Learning

要約 Vision-Language Models(VLMS)は、視覚データとテ … 続きを読む

カテゴリー: cs.CV, cs.LG | Visual Adaptive Prompting for Compositional Zero-Shot Learning はコメントを受け付けていません

T2I-FineEval: Fine-Grained Compositional Metric for Text-to-Image Evaluation

要約 最近のテキストからイメージまでの生成モデルは印象的なパフォーマンスを達成し … 続きを読む

カテゴリー: cs.CV | T2I-FineEval: Fine-Grained Compositional Metric for Text-to-Image Evaluation はコメントを受け付けていません

V-STaR: Benchmarking Video-LLMs on Video Spatio-Temporal Reasoning

要約 人間のプロセスビデオ推論を順次空間的推論ロジックで、最初に関連するフレーム … 続きを読む

カテゴリー: cs.CV | V-STaR: Benchmarking Video-LLMs on Video Spatio-Temporal Reasoning はコメントを受け付けていません

Cognitive Disentanglement for Referring Multi-Object Tracking

要約 インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む

カテゴリー: cs.CV | Cognitive Disentanglement for Referring Multi-Object Tracking はコメントを受け付けていません

Cloud2BIM: An open-source automatic pipeline for efficient conversion of large-scale point clouds into IFC format

要約 ビルディング情報モデリング(BIM)は、老化構造の持続可能な再構築と再生に … 続きを読む

カテゴリー: cs.CV, cs.SE | Cloud2BIM: An open-source automatic pipeline for efficient conversion of large-scale point clouds into IFC format はコメントを受け付けていません