cs.CV」カテゴリーアーカイブ

Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation

要約 3D ヒューマンパラメトリック モデル (SMPL) を使用して、事前学習 … 続きを読む

カテゴリー: cs.CV | Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation はコメントを受け付けていません

Convolutional Differentiable Logic Gate Networks

要約 機械学習モデルの推論コストの増加に伴い、高速かつ効率的な推論を備えたモデル … 続きを読む

カテゴリー: cs.CV, cs.LG | Convolutional Differentiable Logic Gate Networks はコメントを受け付けていません

Taming Rectified Flow for Inversion and Editing

要約 FLUX や OpenSora などの整流ベースの拡散変圧器は、画像および … 続きを読む

カテゴリー: cs.CV | Taming Rectified Flow for Inversion and Editing はコメントを受け付けていません

SpikeBottleNet: Spike-Driven Feature Compression Architecture for Edge-Cloud Co-Inference

要約 エッジとクラウドの協調推論は、エッジ デバイスとクラウド サーバーの間でア … 続きを読む

カテゴリー: cs.CV | SpikeBottleNet: Spike-Driven Feature Compression Architecture for Edge-Cloud Co-Inference はコメントを受け付けていません

DiT4Edit: Diffusion Transformer for Image Editing

要約 UNet ベースの画像編集は最近進歩していますが、高解像度画像で形状を認識 … 続きを読む

カテゴリー: cs.CV | DiT4Edit: Diffusion Transformer for Image Editing はコメントを受け付けていません

An Effective Pipeline for Whole-Slide Image Glomerulus Segmentation

要約 全スライド画像 (WSI) 糸球体のセグメンテーションは、腎臓疾患を正確に … 続きを読む

カテゴリー: cs.CV, eess.IV | An Effective Pipeline for Whole-Slide Image Glomerulus Segmentation はコメントを受け付けていません

BrainSegFounder: Towards 3D Foundation Models for Neuroimage Segmentation

要約 脳の健康研究の急成長分野では、神経学的データの解釈と分析に人工知能 (AI … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.NC | BrainSegFounder: Towards 3D Foundation Models for Neuroimage Segmentation はコメントを受け付けていません

Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance

要約 マルチモーダル大規模言語モデル (MLLM) は、幅広い領域にわたる視覚言 … 続きを読む

カテゴリー: cs.CV | Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance はコメントを受け付けていません

MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation

要約 ビジュアル オドメトリ (VO) は、GPS センサーやコンパス センサー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation はコメントを受け付けていません

Interpreting CLIP: Insights on the Robustness to ImageNet Distribution Shifts

要約 ロバストなモデルとロバストでないモデルの違いは何でしょうか? ImageN … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Interpreting CLIP: Insights on the Robustness to ImageNet Distribution Shifts はコメントを受け付けていません