月別アーカイブ: 2024年7月

Reference-Based 3D-Aware Image Editing with Triplanes

要約 Generative Adversarial Networks (GAN) … 続きを読む

カテゴリー: cs.CV | Reference-Based 3D-Aware Image Editing with Triplanes はコメントを受け付けていません

HAIFIT: Human-Centered AI for Fashion Image Translation

要約 ファッション デザインの領域では、スケッチはアーティストの独特の描画スタイ … 続きを読む

カテゴリー: cs.CV | HAIFIT: Human-Centered AI for Fashion Image Translation はコメントを受け付けていません

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

要約 セマンティック セグメンテーション モデルは通常、固定されたクラスのセット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception はコメントを受け付けていません

Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers

要約 ビジョン トランスフォーマー (ViT) は、畳み込みニューラル ネットワ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers はコメントを受け付けていません

PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations

要約 この研究では、インターネット デモンストレーションを使用してピアノ演奏エー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations はコメントを受け付けていません

Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) は高速かつ高品質の新規ビュー … 続きを読む

カテゴリー: cs.CV | Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting はコメントを受け付けていません

Geometry Fidelity for Spherical Images

要約 全天球または全方向画像は、幅広いコンピュータ ビジョン アプリケーションに … 続きを読む

カテゴリー: cs.CV, cs.LG | Geometry Fidelity for Spherical Images はコメントを受け付けていません

Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference

要約 ビジョン トランスフォーマー (ViT) は優れたパフォーマンスを示してい … 続きを読む

カテゴリー: cs.CV | Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference はコメントを受け付けていません

Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion

要約 我々は、オンザフライで合成された都市スケールのシーンを通じて、街並みに相当 … 続きを読む

カテゴリー: cs.CV, cs.GR | Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion はコメントを受け付けていません

LION: Linear Group RNN for 3D Object Detection in Point Clouds

要約 3D オブジェクト検出などの大規模な 3D 点群認識タスクにおけるトランス … 続きを読む

カテゴリー: cs.CV | LION: Linear Group RNN for 3D Object Detection in Point Clouds はコメントを受け付けていません