-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
Rephrase, Augment, Reason: Visual Grounding of Questions for Vision-Language Models
要約 大規模言語モデル (LLM) をビジョン エンコーダに結合し、大規模ビジョ … 続きを読む
Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion
要約 画像の高品質なセグメンテーション マスクを作成することは、コンピューター … 続きを読む
カテゴリー: cs.CV
Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion はコメントを受け付けていません
ViTamin: Designing Scalable Vision Models in the Vision-Language Era
要約 ビジョン言語モデル (VLM) における最近の進歩により、ビジョン コミュ … 続きを読む
カテゴリー: cs.CV
ViTamin: Designing Scalable Vision Models in the Vision-Language Era はコメントを受け付けていません
ResNet with Integrated Convolutional Block Attention Module for Ship Classification Using Transfer Learning on Optical Satellite Imagery
要約 この研究では、高解像度の光学リモートセンシング衛星画像を使用して船舶を効果 … 続きを読む
Iterated Learning Improves Compositionality in Large Vision-Language Models
要約 人間の視覚と自然言語の両方に共通する基本的な特徴は、その構成的な性質です。 … 続きを読む
カテゴリー: cs.CV
Iterated Learning Improves Compositionality in Large Vision-Language Models はコメントを受け付けていません
Diffusion$^2$: Dynamic 3D Content Generation via Score Composition of Orthogonal Diffusion Models
要約 最近の 3D 生成の進歩は主に、インターネット規模の画像データで事前トレー … 続きを読む
カテゴリー: cs.CV
Diffusion$^2$: Dynamic 3D Content Generation via Score Composition of Orthogonal Diffusion Models はコメントを受け付けていません
GeneAvatar: Generic Expression-Aware Volumetric Head Avatar Editing from a Single Image
要約 最近、アニメーション化可能な頭部アバターのモデリングにおいて、さまざまな体 … 続きを読む
カテゴリー: cs.CV
GeneAvatar: Generic Expression-Aware Volumetric Head Avatar Editing from a Single Image はコメントを受け付けていません
Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration
要約 オールインワンの画像復元では、劣化ごとにタスク固有の非汎用モデルを使用する … 続きを読む
カテゴリー: cs.CV
Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration はコメントを受け付けていません
Alpha Invariance: On Inverse Scaling Between Distance and Volume Density in Neural Radiance Fields
要約 3D シーンの寸法におけるスケールの曖昧さは、神経放射フィールドの体積密度 … 続きを読む
カテゴリー: cs.CV
Alpha Invariance: On Inverse Scaling Between Distance and Volume Density in Neural Radiance Fields はコメントを受け付けていません
Segment Any 3D Object with Language
要約 この論文では、自由形式の言語命令を使用した Open-Vocabulary … 続きを読む