cs.CV」カテゴリーアーカイブ

Satellite Imagery and AI: A New Era in Ocean Conservation, from Research to Deployment and Impact (Version. 2.0)

要約 違法で、報告されていない、規制されていない(IUU)釣りは、海洋生息地に対 … 続きを読む

カテゴリー: cs.CV | Satellite Imagery and AI: A New Era in Ocean Conservation, from Research to Deployment and Impact (Version. 2.0) はコメントを受け付けていません

Skin Lesion Phenotyping via Nested Multi-modal Contrastive Learning

要約 画像とメタデータの間の複雑な関係を捉える新しいネストされたコントラスト学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Skin Lesion Phenotyping via Nested Multi-modal Contrastive Learning はコメントを受け付けていません

AnySplat: Feed-forward 3D Gaussian Splatting from Unconstrained Views

要約 非調整された画像コレクションからの新しいビュー合成のためのフィードフォワー … 続きを読む

カテゴリー: cs.CV | AnySplat: Feed-forward 3D Gaussian Splatting from Unconstrained Views はコメントを受け付けていません

FMG-Det: Foundation Model Guided Robust Object Detection

要約 オブジェクトの境界をラベル付けする際の固有の主観性のため、オブジェクト検出 … 続きを読む

カテゴリー: cs.CV | FMG-Det: Foundation Model Guided Robust Object Detection はコメントを受け付けていません

PixelThink: Towards Efficient Chain-of-Pixel Reasoning

要約 既存の推論セグメンテーションアプローチは、通常、画像テキストペアと対応する … 続きを読む

カテゴリー: cs.CV, cs.MM | PixelThink: Towards Efficient Chain-of-Pixel Reasoning はコメントを受け付けていません

ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS

要約 フィードフォワード3Dガウススプラッティング(3DGS)モデルは最近、新し … 続きを読む

カテゴリー: cs.CV | ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS はコメントを受け付けていません

How Animals Dance (When You’re Not Looking)

要約 音楽を同期し、振り付け認識アニマルダンスビデオを生成するためのキーフレーム … 続きを読む

カテゴリー: cs.CV, cs.GR | How Animals Dance (When You’re Not Looking) はコメントを受け付けていません

Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis

要約 基礎モデルと大規模な言語モデル(LLMS)の急速な進歩は、ミトリモーダル入 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis はコメントを受け付けていません

LayerPeeler: Autoregressive Peeling for Layer-wise Image Vectorization

要約 画像ベクトル化は、ラスター画像をベクターグラフィックスに変換する強力な手法 … 続きを読む

カテゴリー: cs.CV, cs.GR | LayerPeeler: Autoregressive Peeling for Layer-wise Image Vectorization はコメントを受け付けていません

MAGREF: Masked Guidance for Any-Reference Video Generation

要約 ビデオ生成は、深い生成モデル、特に拡散ベースのアプローチの出現に大きな進歩 … 続きを読む

カテゴリー: cs.AI, cs.CV | MAGREF: Masked Guidance for Any-Reference Video Generation はコメントを受け付けていません