-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Reference-Based 3D-Aware Image Editing with Triplanes
要約 Generative Adversarial Networks (GAN) … 続きを読む
カテゴリー: cs.CV
Reference-Based 3D-Aware Image Editing with Triplanes はコメントを受け付けていません
HAIFIT: Human-Centered AI for Fashion Image Translation
要約 ファッション デザインの領域では、スケッチはアーティストの独特の描画スタイ … 続きを読む
カテゴリー: cs.CV
HAIFIT: Human-Centered AI for Fashion Image Translation はコメントを受け付けていません
Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception
要約 セマンティック セグメンテーション モデルは通常、固定されたクラスのセット … 続きを読む
Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers
要約 ビジョン トランスフォーマー (ViT) は、畳み込みニューラル ネットワ … 続きを読む
PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations
要約 この研究では、インターネット デモンストレーションを使用してピアノ演奏エー … 続きを読む
Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting
要約 3D ガウス スプラッティング (3DGS) は高速かつ高品質の新規ビュー … 続きを読む
カテゴリー: cs.CV
Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting はコメントを受け付けていません
Geometry Fidelity for Spherical Images
要約 全天球または全方向画像は、幅広いコンピュータ ビジョン アプリケーションに … 続きを読む
Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference
要約 ビジョン トランスフォーマー (ViT) は優れたパフォーマンスを示してい … 続きを読む
カテゴリー: cs.CV
Castling-ViT: Compressing Self-Attention via Switching Towards Linear-Angular Attention at Vision Transformer Inference はコメントを受け付けていません
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion
要約 我々は、オンザフライで合成された都市スケールのシーンを通じて、街並みに相当 … 続きを読む
LION: Linear Group RNN for 3D Object Detection in Point Clouds
要約 3D オブジェクト検出などの大規模な 3D 点群認識タスクにおけるトランス … 続きを読む
カテゴリー: cs.CV
LION: Linear Group RNN for 3D Object Detection in Point Clouds はコメントを受け付けていません