-
最近の投稿
- Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks
- Aligned Datasets Improve Detection of Latent Diffusion-Generated Images
- GHOST 2.0: generative high-fidelity one shot transfer of heads
- The FFT Strikes Back: An Efficient Alternative to Self-Attention
- Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation
-
最近のコメント
表示できるコメントはありません。 cs.AI (34245) cs.CL (25889) cs.CR (2632) cs.CV (40147) cs.LG (39248) cs.RO (19997) cs.SY (3038) eess.IV (4777) eess.SY (3032) stat.ML (5176)
月別アーカイブ: 2024年9月
Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation
要約 自己教師あり事前トレーニング (SSP) は、大規模なラベルなしデータセッ … 続きを読む
AI-Powered Augmented Reality for Satellite Assembly, Integration and Test
要約 人工知能 (AI) と拡張現実 (AR) の統合により、精度が向上し、人的 … 続きを読む
MALPOLON: A Framework for Deep Species Distribution Modeling
要約 このペーパーでは、ディープ SDM フレームワークである MALPOLON … 続きを読む
Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats
要約 地球上のカリスマ的な巨大動物の多くは人間の活動によって絶滅の危機に瀕してお … 続きを読む
E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding
要約 ビデオ大規模言語モデル (Video-LLM) の最近の進歩により、汎用ビ … 続きを読む
カテゴリー: cs.CV
E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding はコメントを受け付けていません
EdgeRunner: Auto-regressive Auto-encoder for Artistic Mesh Generation
要約 現在の自己回帰メッシュ生成方法には、不完全さ、不十分な詳細、貧弱な一般化な … 続きを読む
カテゴリー: cs.CV
EdgeRunner: Auto-regressive Auto-encoder for Artistic Mesh Generation はコメントを受け付けていません
Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography
要約 Contrastive Language-Image Pre-traini … 続きを読む
EvMAPPER: High Altitude Orthomapping with Event Cameras
要約 従来、無人航空機 (UAV) は、CMOS ベースのカメラを利用して下界の … 続きを読む
Robot See Robot Do: Imitating Articulated Object Manipulation with Monocular 4D Reconstruction
要約 人間は、他の物体を観察するだけで、新しい物体を操作する方法を学ぶことができ … 続きを読む
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction
要約 事前トレーニングされたテキストから画像への拡散モデルの視覚事前分布を活用す … 続きを読む
カテゴリー: cs.CV
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction はコメントを受け付けていません