-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Caltech Aerial RGB-Thermal Dataset in the Wild
要約 私たちは、自然環境で動作する航空ロボット用に設計された、初の一般公開された … 続きを読む
Outlier Detection in Large Radiological Datasets using UMAP
要約 機械学習アルゴリズムの成功は、サンプルの品質とそれに対応するラベルの精度に … 続きを読む
DDU-Net: A Domain Decomposition-based CNN for High-Resolution Image Segmentation on Multiple GPUs
要約 超高解像度画像のセグメンテーションには、空間情報の損失や計算効率の低下など … 続きを読む
Quantum Hamiltonian Embedding of Images for Data Reuploading Classifiers
要約 量子コンピューティングを機械学習タスクに適用する場合、最初に考慮すべきこと … 続きを読む
A Dual-way Enhanced Framework from Text Matching Point of View for Multimodal Entity Linking
要約 マルチモーダル エンティティ リンク (MEL) は、マルチモーダル情報を … 続きを読む
Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network
要約 超解像度再構成技術では、ソフトウェア アルゴリズムを使用して、同じシーンか … 続きを読む
Adaptive Self-training Framework for Fine-grained Scene Graph Generation
要約 シーン グラフ生成 (SGG) モデルは、長い尾の述語分布やアノテーション … 続きを読む
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models
要約 最近、Web 画像の台頭により、大規模な画像データセットの管理と理解の重要 … 続きを読む
Depth-Wise Convolutions in Vision Transformers for Efficient Training on Small Datasets
要約 Vision Transformer (ViT) は、Transforme … 続きを読む
カテゴリー: cs.CV
Depth-Wise Convolutions in Vision Transformers for Efficient Training on Small Datasets はコメントを受け付けていません
SpatialBot: Precise Spatial Understanding with Vision Language Models
要約 ビジョン言語モデル (VLM) は、2D 画像理解において目覚ましいパフォ … 続きを読む
カテゴリー: cs.CV
SpatialBot: Precise Spatial Understanding with Vision Language Models はコメントを受け付けていません