cs.CV」カテゴリーアーカイブ

CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities

要約 カスタマイズされたビデオ生成は、テキスト プロンプトと被験者の参照画像に基 … 続きを読む

カテゴリー: cs.CV | CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities はコメントを受け付けていません

MCTR: Multi Camera Tracking Transformer

要約 マルチカメラ追跡は、現実世界のさまざまなアプリケーションにおいて極めて重要 … 続きを読む

カテゴリー: cs.CV | MCTR: Multi Camera Tracking Transformer はコメントを受け付けていません

Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption

要約 半導体のイメージングと分析は重要であるにもかかわらず、ディープラーニングの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption はコメントを受け付けていません

Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack

要約 顔のなりすまし防止アルゴリズムは、プレゼンテーション攻撃に対する顔認識シス … 続きを読む

カテゴリー: cs.CV | Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack はコメントを受け付けていません

LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation

要約 3D イマーシブ シーンの生成は、コンピュータ ビジョンとグラフィックスに … 続きを読む

カテゴリー: cs.CV | LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation はコメントを受け付けていません

Ensemble Modeling of Multiple Physical Indicators to Dynamically Phenotype Autism Spectrum Disorder

要約 社会的コミュニケーションの困難を特徴とする神経発達障害である自閉症は、タイ … 続きを読む

カテゴリー: cs.AI, cs.CV | Ensemble Modeling of Multiple Physical Indicators to Dynamically Phenotype Autism Spectrum Disorder はコメントを受け付けていません

How Diffusion Models Learn to Factorize and Compose

要約 拡散モデルは、トレーニング セットに一緒に表示されない可能性が高い要素を組 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | How Diffusion Models Learn to Factorize and Compose はコメントを受け付けていません

MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?

要約 マルチモーダル大規模言語モデル (MLLM) の包括的な評価は、最近研究コ … 続きを読む

カテゴリー: cs.CV | MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? はコメントを受け付けていません

GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections

要約 一般的なテキストから画像へのモデルは、芸術、デザイン、メディアの分野に革命 … 続きを読む

カテゴリー: cs.CV | GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections はコメントを受け付けていません

UMERegRobust — Universal Manifold Embedding Compatible Features for Robust Point Cloud Registration

要約 この論文では、剛体変換の推定にユニバーサル多様体埋め込み (UME) フレ … 続きを読む

カテゴリー: cs.CV | UMERegRobust — Universal Manifold Embedding Compatible Features for Robust Point Cloud Registration はコメントを受け付けていません