月別アーカイブ: 2023年8月

TS-RGBD Dataset: a Novel Dataset for Theatre Scenes Description for People with Visual Impairments

要約 コンピューター ビジョンは、長い間、視覚障害者が周囲を移動し、障害物や転倒 … 続きを読む

カテゴリー: cs.CV | TS-RGBD Dataset: a Novel Dataset for Theatre Scenes Description for People with Visual Impairments はコメントを受け付けていません

WCCNet: Wavelet-integrated CNN with Crossmodal Rearranging Fusion for Fast Multispectral Pedestrian Detection

要約 マルチスペクトル歩行者検出は、困難な状況でも良好な視認性を実現するため、精 … 続きを読む

カテゴリー: cs.CV | WCCNet: Wavelet-integrated CNN with Crossmodal Rearranging Fusion for Fast Multispectral Pedestrian Detection はコメントを受け付けていません

Ada-TTA: Towards Adaptive High-Quality Text-to-Talking Avatar Synthesis

要約 私たちは、新しいタスク、つまり、低リソースのテキストで会話するアバターに興 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Ada-TTA: Towards Adaptive High-Quality Text-to-Talking Avatar Synthesis はコメントを受け付けていません

Dynamic Token Pruning in Plain Vision Transformers for Semantic Segmentation

要約 ビジョン トランスフォーマーは、さまざまな視覚タスクで優れたパフォーマンス … 続きを読む

カテゴリー: cs.CV | Dynamic Token Pruning in Plain Vision Transformers for Semantic Segmentation はコメントを受け付けていません

MammoDG: Generalisable Deep Learning Breaks the Limits of Cross-Domain Multi-Center Breast Cancer Screening

要約 乳がんは女性のがんによる死亡の主な原因であり、治療成果と生活の質の向上には … 続きを読む

カテゴリー: cs.CV | MammoDG: Generalisable Deep Learning Breaks the Limits of Cross-Domain Multi-Center Breast Cancer Screening はコメントを受け付けていません

Improving Generalization of Synthetically Trained Sonar Image Descriptors for Underwater Place Recognition

要約 水中環境での自律航行には、光の吸収や水の濁りなどの要因により課題が生じ、光 … 続きを読む

カテゴリー: cs.CV, cs.RO | Improving Generalization of Synthetically Trained Sonar Image Descriptors for Underwater Place Recognition はコメントを受け付けていません

Homography Estimation in Complex Topological Scenes

要約 監視ビデオと画像は、交通分析から犯罪検出に至るまで、幅広いアプリケーション … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Homography Estimation in Complex Topological Scenes はコメントを受け付けていません

Hand tracking for clinical applications: validation of the Google MediaPipe Hand (GMH) and the depth-enhanced GMH-D frameworks

要約 手や指の動きを正確に 3D 追跡することは、コンピュータ ビジョンにおいて … 続きを読む

カテゴリー: cs.AI, cs.CV | Hand tracking for clinical applications: validation of the Google MediaPipe Hand (GMH) and the depth-enhanced GMH-D frameworks はコメントを受け付けていません

LMEye: An Interactive Perception Network for Large Language Models

要約 GPT-4 のように、Large Visual Language Mode … 続きを読む

カテゴリー: cs.AI, cs.CV | LMEye: An Interactive Perception Network for Large Language Models はコメントを受け付けていません

AutoPoster: A Highly Automatic and Content-aware Design System for Advertising Poster Generation

要約 情報プレゼンテーションの一種である広告ポスターは、視覚的様式と言語的様式を … 続きを読む

カテゴリー: cs.CV | AutoPoster: A Highly Automatic and Content-aware Design System for Advertising Poster Generation はコメントを受け付けていません