月別アーカイブ: 2023年7月

Scale-Aware Modulation Meet Transformer

要約 本稿では、畳み込みネットワークとビジョン Transformer を組み合 … 続きを読む

カテゴリー: cs.CV | Scale-Aware Modulation Meet Transformer はコメントを受け付けていません

LDMVFI: Video Frame Interpolation with Latent Diffusion Models

要約 ビデオ フレーム補間 (VFI) に関する既存の研究では、主に、出力とグラ … 続きを読む

カテゴリー: cs.CV, eess.IV | LDMVFI: Video Frame Interpolation with Latent Diffusion Models はコメントを受け付けていません

BuboGPT: Enabling Visual Grounding in Multi-Modal LLMs

要約 LLM は、特に命令に従うデータの使用において、言語を通じて人間と対話する … 続きを読む

カテゴリー: cs.AI, cs.CV | BuboGPT: Enabling Visual Grounding in Multi-Modal LLMs はコメントを受け付けていません

Identity-Preserving Aging of Face Images via Latent Diffusion Models

要約 自動顔認識システムのパフォーマンスは、必然的に顔の老化プロセスの影響を受け … 続きを読む

カテゴリー: cs.CV | Identity-Preserving Aging of Face Images via Latent Diffusion Models はコメントを受け付けていません

Multimodal Diffusion Segmentation Model for Object Segmentation from Manipulation Instructions

要約 この研究では、自然言語の指示 (例: 「リビング ルームに行って、壁のラジ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | Multimodal Diffusion Segmentation Model for Object Segmentation from Manipulation Instructions はコメントを受け付けていません

Benchmarking fixed-length Fingerprint Representations across different Embedding Sizes and Sensor Types

要約 従来の特徴点ベースの指紋表現は、可変長の特徴点のセットで構成されます。 こ … 続きを読む

カテゴリー: cs.CV | Benchmarking fixed-length Fingerprint Representations across different Embedding Sizes and Sensor Types はコメントを受け付けていません

Deficiency-Aware Masked Transformer for Video Inpainting

要約 最近のビデオ修復手法は、オプティカル フローなどの明示的なガイダンスを利用 … 続きを読む

カテゴリー: cs.CV | Deficiency-Aware Masked Transformer for Video Inpainting はコメントを受け付けていません

PolyGNN: Polyhedron-based Graph Neural Network for 3D Building Reconstruction from Point Clouds

要約 点群から 3D 建物を再構築するための多面体ベースのグラフ ニューラル ネ … 続きを読む

カテゴリー: cs.CV | PolyGNN: Polyhedron-based Graph Neural Network for 3D Building Reconstruction from Point Clouds はコメントを受け付けていません

Quaternion Convolutional Neural Networks: Current Advances and Future Directions

要約 畳み込みニューラル ネットワーク (CNN) は、最初の応用以来、いくつか … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.0 | Quaternion Convolutional Neural Networks: Current Advances and Future Directions はコメントを受け付けていません

CohortFinder: an open-source tool for data-driven partitioning of biomedical image cohorts to yield robust machine learning models

要約 バッチ効果 (BE) とは、生物学的変動とは関係のないデータ収集における体 … 続きを読む

カテゴリー: cs.CV, cs.LG | CohortFinder: an open-source tool for data-driven partitioning of biomedical image cohorts to yield robust machine learning models はコメントを受け付けていません