月別アーカイブ: 2024年1月

SVGDreamer: Text Guided SVG Generation with Diffusion Model

投稿日: 2024年1月4日作成者: jarxiv

要約近年、テキストガイドによるスケーラブル・ベクター・グラフィックス（SVG） … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SYNTA: A novel approach for deep learning-based image analysis in muscle histopathology using photo-realistic synthetic data

投稿日: 2024年1月4日作成者: jarxiv

要約人工知能（AI）、機械学習、深層学習（DL）の手法は、生物医学画像解析の分 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

aMUSEd: An Open MUSE Reproduction

投稿日: 2024年1月4日作成者: jarxiv

要約 aMUSEdは、MUSEをベースとしたテキスト画像生成のためのオープンソー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Detours for Navigating Instructional Videos

投稿日: 2024年1月4日作成者: jarxiv

要約解説ビデオをナビゲートするための迂回ビデオ問題を紹介する。ソースビデオと、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HawkRover: An Autonomous mmWave Vehicular Communication Testbed with Multi-sensor Fusion and Deep Learning

投稿日: 2024年1月4日作成者: jarxiv

要約コネクテッドカーと自動運転車（CAV）は、私たちの日常生活を一変させる技術 … 続きを読む →

カテゴリー: cs.CV, cs.IT, math.IT | コメントを受け付けていません

M3D: Dataset Condensation by Minimizing Maximum Mean Discrepancy

投稿日: 2024年1月4日作成者: jarxiv

要約最先端の（SOTA）ディープモデルの学習には、多くの場合、膨大なデータが必 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions

投稿日: 2024年1月4日作成者: jarxiv

要約既存のビデオ拡散モデル（VDM）のほとんどは、単なるテキスト条件に限定され … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Frequency Domain Modality-invariant Feature Learning for Visible-infrared Person Re-Identification

投稿日: 2024年1月4日作成者: jarxiv

要約可視-赤外人物再同定（VI-ReID）は、可視画像と赤外画像の間の著しいク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Synthetic dataset of ID and Travel Document

投稿日: 2024年1月4日作成者: jarxiv

要約本論文では、SIDTDと呼ばれるIDおよび旅行文書の新しい合成データセット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Vision Check-up for Language Models

投稿日: 2024年1月4日作成者: jarxiv

要約文字列間の関係をモデル化する学習は、視覚世界について大規模言語モデル（LL … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年1月

SVGDreamer: Text Guided SVG Generation with Diffusion Model

SYNTA: A novel approach for deep learning-based image analysis in muscle histopathology using photo-realistic synthetic data

aMUSEd: An Open MUSE Reproduction

Detours for Navigating Instructional Videos

HawkRover: An Autonomous mmWave Vehicular Communication Testbed with Multi-sensor Fusion and Deep Learning

M3D: Dataset Condensation by Minimizing Maximum Mean Discrepancy

Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions

Frequency Domain Modality-invariant Feature Learning for Visible-infrared Person Re-Identification

Synthetic dataset of ID and Travel Document

A Vision Check-up for Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー