月別アーカイブ: 2024年1月

SVGDreamer: Text Guided SVG Generation with Diffusion Model

要約 近年、テキストガイドによるスケーラブル・ベクター・グラフィックス(SVG) … 続きを読む

カテゴリー: cs.AI, cs.CV | SVGDreamer: Text Guided SVG Generation with Diffusion Model はコメントを受け付けていません

SYNTA: A novel approach for deep learning-based image analysis in muscle histopathology using photo-realistic synthetic data

要約 人工知能(AI)、機械学習、深層学習(DL)の手法は、生物医学画像解析の分 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SYNTA: A novel approach for deep learning-based image analysis in muscle histopathology using photo-realistic synthetic data はコメントを受け付けていません

aMUSEd: An Open MUSE Reproduction

要約 aMUSEdは、MUSEをベースとしたテキスト画像生成のためのオープンソー … 続きを読む

カテゴリー: cs.CV | aMUSEd: An Open MUSE Reproduction はコメントを受け付けていません

Detours for Navigating Instructional Videos

要約 解説ビデオをナビゲートするための迂回ビデオ問題を紹介する。ソースビデオと、 … 続きを読む

カテゴリー: cs.CV | Detours for Navigating Instructional Videos はコメントを受け付けていません

HawkRover: An Autonomous mmWave Vehicular Communication Testbed with Multi-sensor Fusion and Deep Learning

要約 コネクテッドカーと自動運転車(CAV)は、私たちの日常生活を一変させる技術 … 続きを読む

カテゴリー: cs.CV, cs.IT, math.IT | HawkRover: An Autonomous mmWave Vehicular Communication Testbed with Multi-sensor Fusion and Deep Learning はコメントを受け付けていません

M3D: Dataset Condensation by Minimizing Maximum Mean Discrepancy

要約 最先端の(SOTA)ディープモデルの学習には、多くの場合、膨大なデータが必 … 続きを読む

カテゴリー: cs.CV, cs.LG | M3D: Dataset Condensation by Minimizing Maximum Mean Discrepancy はコメントを受け付けていません

Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions

要約 既存のビデオ拡散モデル(VDM)のほとんどは、単なるテキスト条件に限定され … 続きを読む

カテゴリー: cs.CV | Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions はコメントを受け付けていません

Frequency Domain Modality-invariant Feature Learning for Visible-infrared Person Re-Identification

要約 可視-赤外人物再同定(VI-ReID)は、可視画像と赤外画像の間の著しいク … 続きを読む

カテゴリー: cs.CV | Frequency Domain Modality-invariant Feature Learning for Visible-infrared Person Re-Identification はコメントを受け付けていません

Synthetic dataset of ID and Travel Document

要約 本論文では、SIDTDと呼ばれるIDおよび旅行文書の新しい合成データセット … 続きを読む

カテゴリー: cs.CV | Synthetic dataset of ID and Travel Document はコメントを受け付けていません

A Vision Check-up for Language Models

要約 文字列間の関係をモデル化する学習は、視覚世界について大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Vision Check-up for Language Models はコメントを受け付けていません