cs.CV」カテゴリーアーカイブ

GarmentTracking: Category-Level Garment Pose Tracking

要約 衣服は人間にとって重要です。 完全な衣服のポーズを推定および追跡できる視覚 … 続きを読む

カテゴリー: cs.CV, cs.RO | GarmentTracking: Category-Level Garment Pose Tracking はコメントを受け付けていません

Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning

要約 このペーパーでは、マルチモーダル大手言語モデル(MLLM)のルールベースの … 続きを読む

カテゴリー: cs.CV | Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning はコメントを受け付けていません

Autoregressive Distillation of Diffusion Transformers

要約 トランスアーキテクチャを備えた拡散モデルは、高忠実度の画像と高解像度のスケ … 続きを読む

カテゴリー: cs.CV | Autoregressive Distillation of Diffusion Transformers はコメントを受け付けていません

Cognitive Disentanglement for Referring Multi-Object Tracking

要約 インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む

カテゴリー: cs.CV | Cognitive Disentanglement for Referring Multi-Object Tracking はコメントを受け付けていません

EchoMask: Speech-Queried Attention-based Mask Modeling for Holistic Co-Speech Motion Generation

要約 マスクされたモデリングフレームワークは、共和声モーション生成に有望を示して … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD | EchoMask: Speech-Queried Attention-based Mask Modeling for Holistic Co-Speech Motion Generation はコメントを受け付けていません

CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection

要約 木材処理産業の品質管理を確保するには、木材の欠陥検出が重要です。 ただし、 … 続きを読む

カテゴリー: cs.AI, cs.CV | CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection はコメントを受け付けていません

Context-Aware Palmprint Recognition via a Relative Similarity Metric

要約 既存のマッチングフレームワークの堅牢性と識別性を高める相対類似性メトリック … 続きを読む

カテゴリー: cs.CV | Context-Aware Palmprint Recognition via a Relative Similarity Metric はコメントを受け付けていません

Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks

要約 速度(SOS)は組織の生体力学的特性であり、そのイメージングは​​診断のた … 続きを読む

カテゴリー: cs.CV | Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks はコメントを受け付けていません

Big Brother is Watching: Proactive Deepfake Detection via Learnable Hidden Face

要約 Deepfake Technologiesが進歩し続けるにつれて、受動的検 … 続きを読む

カテゴリー: cs.CV | Big Brother is Watching: Proactive Deepfake Detection via Learnable Hidden Face はコメントを受け付けていません

PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild

要約 このレポートは、CVPR 2025と協力して開催されたWild(PVU)チ … 続きを読む

カテゴリー: cs.CV | PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild はコメントを受け付けていません