月別アーカイブ: 2024年7月

Reference-Based 3D-Aware Image Editing with Triplanes

投稿日: 2024年7月26日作成者: jarxiv

要約 Generative Adversarial Networks (GAN) … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HAIFIT: Human-Centered AI for Fashion Image Translation

投稿日: 2024年7月26日作成者: jarxiv

要約ファッションデザインの領域では、スケッチはアーティストの独特の描画スタイ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

投稿日: 2024年7月26日作成者: jarxiv

要約セマンティックセグメンテーションモデルは通常、固定されたクラスのセット … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers

投稿日: 2024年7月26日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、畳み込みニューラルネットワ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations

投稿日: 2024年7月26日作成者: jarxiv

要約この研究では、インターネットデモンストレーションを使用してピアノ演奏エー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting

投稿日: 2024年7月26日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) は高速かつ高品質の新規ビュー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Geometry Fidelity for Spherical Images

投稿日: 2024年7月26日作成者: jarxiv

要約全天球または全方向画像は、幅広いコンピュータビジョンアプリケーションに … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference

投稿日: 2024年7月26日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は優れたパフォーマンスを示してい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion

投稿日: 2024年7月26日作成者: jarxiv

要約我々は、オンザフライで合成された都市スケールのシーンを通じて、街並みに相当 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

LION: Linear Group RNN for 3D Object Detection in Point Clouds

投稿日: 2024年7月26日作成者: jarxiv

要約 3D オブジェクト検出などの大規模な 3D 点群認識タスクにおけるトランス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年7月

Reference-Based 3D-Aware Image Editing with Triplanes

HAIFIT: Human-Centered AI for Fashion Image Translation

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers

PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations

Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting

Geometry Fidelity for Spherical Images

Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference

Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion

LION: Linear Group RNN for 3D Object Detection in Point Clouds

最近の投稿

最近のコメント

アーカイブ

カテゴリー