-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation
要約 3D 対応の敵対的生成ネットワーク (GAN) の最近の進歩は、ほぼ正面か … 続きを読む
カテゴリー: cs.CV
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation はコメントを受け付けていません
Retrieval-Augmented Open-Vocabulary Object Detection
要約 オープン語彙オブジェクト検出 (OVD) は、事前トレーニングされたカテゴ … 続きを読む
カテゴリー: cs.CV
Retrieval-Augmented Open-Vocabulary Object Detection はコメントを受け付けていません
Evaluating the Efficacy of Cut-and-Paste Data Augmentation in Semantic Segmentation for Satellite Imagery
要約 衛星画像は、環境モニタリングや都市計画などのタスクにとって非常に重要です。 … 続きを読む
Learning 3D-Aware GANs from Unposed Images with Template Feature Field
要約 トレーニング画像の正確なカメラポーズを収集することは、3D 対応の敵対的生 … 続きを読む
カテゴリー: cs.CV
Learning 3D-Aware GANs from Unposed Images with Template Feature Field はコメントを受け付けていません
Energy-Calibrated VAE with Test Time Free Lunch
要約 この論文では、変分オートエンコーダ (VAE) を強化するために条件付きエ … 続きを読む
カテゴリー: cs.CV
Energy-Calibrated VAE with Test Time Free Lunch はコメントを受け付けていません
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing
要約 個人コンテンツの効果的な編集は、個人が創造性を表現し、視覚的なストーリーの … 続きを読む
Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩は注目に値します … 続きを読む
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding
要約 大規模言語モデル (LLM) の成功により、ビジョン モデルを LLM に … 続きを読む
カテゴリー: cs.CV
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding はコメントを受け付けていません
Finding Visual Task Vectors
要約 視覚的なプロンプトは、追加のトレーニングを行わずに、コンテキスト内の例を通 … 続きを読む
カテゴリー: cs.CV
Finding Visual Task Vectors はコメントを受け付けていません
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model
要約 この研究では、LLM の開発において中国語を優先するという極めて重要な移行 … 続きを読む