-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年1月
Mining Fine-Grained Image-Text Alignment for Zero-Shot Captioning via Text-Only Training
要約 画像キャプションは、画像の説明的で意味のあるテキスト記述を生成し、幅広い視 … 続きを読む
Audiovisual Masked Autoencoders
要約 自己教師付き表現学習を改善するために、ビデオに既に存在する視聴覚情報を活用 … 続きを読む
Fit-NGP: Fitting Object Models to Neural Graphics Primitives
要約 正確な3D物体姿勢推定は、困難な物体相互作用を伴う多くのロボットアプリケー … 続きを読む
カテゴリー: cs.CV
Fit-NGP: Fitting Object Models to Neural Graphics Primitives はコメントを受け付けていません
A novel method to enhance pneumonia detection via a model-level ensembling of CNN and vision transformer
要約 肺炎は依然として世界的な罹患率と死亡率の主要原因である。胸部X線(CXR) … 続きを読む
An Open and Comprehensive Pipeline for Unified Object Grounding and Detection
要約 Grounding-DINOは、Open-Vocabulary Detec … 続きを読む
カテゴリー: cs.CV
An Open and Comprehensive Pipeline for Unified Object Grounding and Detection はコメントを受け付けていません
Survey of 3D Human Body Pose and Shape Estimation Methods for Contemporary Dance Applications
要約 RGB画像からの3次元人体形状・姿勢推定は、拡張/仮想現実、ヘルスケア、フ … 続きを読む
ChartAssisstant: A Universal Chart Multimodal Language Model via Chart-to-Table Pre-training and Multitask Instruction Tuning
要約 チャートは、データの可視化、データパターンの理解、情報に基づいた意思決定に … 続きを読む
カテゴリー: cs.CV
ChartAssisstant: A Universal Chart Multimodal Language Model via Chart-to-Table Pre-training and Multitask Instruction Tuning はコメントを受け付けていません
UpFusion: Novel View Diffusion from Unposed Sparse View Observations
要約 我々はUpFusionを提案する。UpFusionは新しいビュー合成を行い … 続きを読む
カテゴリー: cs.CV
UpFusion: Novel View Diffusion from Unposed Sparse View Observations はコメントを受け付けていません
Learning the 3D Fauna of the Web
要約 地球上のすべての動物の3Dモデルを学習するには、既存のソリューションを大幅 … 続きを読む
カテゴリー: cs.CV
Learning the 3D Fauna of the Web はコメントを受け付けていません
Learning to Generalize towards Unseen Domains via a Content-Aware Style Invariant Model for Disease Detection from Chest X-rays
要約 分布の不一致による性能低下は、インテリジェントイメージング、特に胸部X線( … 続きを読む