cs.CV」カテゴリーアーカイブ

MM-Skin: Enhancing Dermatology Vision-Language Model with an Image-Text Dataset Derived from Textbooks

要約 医学的視覚言語モデル(VLM)は、さまざまな医療分野で臨床助手として有望で … 続きを読む

カテゴリー: cs.AI, cs.CV | MM-Skin: Enhancing Dermatology Vision-Language Model with an Image-Text Dataset Derived from Textbooks はコメントを受け付けていません

DiffLocks: Generating 3D Hair from a Single Image using Diffusion Models

要約 単一の画像から3Dヘアジオメトリを生成するタスクに対処します。これは、髪型 … 続きを読む

カテゴリー: cs.CV | DiffLocks: Generating 3D Hair from a Single Image using Diffusion Models はコメントを受け付けていません

Patch distribution modeling framework adaptive cosine estimator (PaDiM-ACE) for anomaly detection and localization in synthetic aperture radar imagery

要約 この作業は、既存のパッチ分布モデリングフレームワーク(PADIM)に拡張さ … 続きを読む

カテゴリー: cs.CV | Patch distribution modeling framework adaptive cosine estimator (PaDiM-ACE) for anomaly detection and localization in synthetic aperture radar imagery はコメントを受け付けていません

NeurCross: A Neural Approach to Computing Cross Fields for Quad Mesh Generation

要約 四辺形のメッシュ生成は、コンピューター支援設計とエンジニアリング(CAD/ … 続きを読む

カテゴリー: cs.CV | NeurCross: A Neural Approach to Computing Cross Fields for Quad Mesh Generation はコメントを受け付けていません

MonetGPT: Solving Puzzles Enhances MLLMs’ Image Retouching Skills

要約 レタッチは、生の写真の操作後の不可欠な作業です。 テキストまたはストローク … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | MonetGPT: Solving Puzzles Enhances MLLMs’ Image Retouching Skills はコメントを受け付けていません

Brain Hematoma Marker Recognition Using Multitask Learning: SwinTransformer and Swin-Unet

要約 このペーパーでは、分類およびセマンティックセグメンテーションのためにトラン … 続きを読む

カテゴリー: cs.CV, cs.LG | Brain Hematoma Marker Recognition Using Multitask Learning: SwinTransformer and Swin-Unet はコメントを受け付けていません

Neuro-Symbolic Concepts

要約 この記事では、継続的かつ柔軟に推論することができる建築エージェントの概念中 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Neuro-Symbolic Concepts はコメントを受け付けていません

CrowdMoGen: Zero-Shot Text-Driven Collective Motion Generation

要約 テキストからモーションの生成の最近の進歩は有望な結果を示していますが、通常 … 続きを読む

カテゴリー: cs.CV | CrowdMoGen: Zero-Shot Text-Driven Collective Motion Generation はコメントを受け付けていません

Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation

要約 畳み込みニューラルネットワーク(CNN)とトランスベースのアーキテクチャは … 続きを読む

カテゴリー: cs.CV, eess.IV | Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation はコメントを受け付けていません

Distributional Drift Detection in Medical Imaging with Sketching and Fine-Tuned Transformer

要約 分布ドリフト検出は、機械学習モデルの予測結果に影響を与える可能性のある基礎 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Distributional Drift Detection in Medical Imaging with Sketching and Fine-Tuned Transformer はコメントを受け付けていません