-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
Learning Point Spread Function Invertibility Assessment for Image Deconvolution
要約 Deep-Learning(DL)ベースの画像デコンボリューション(ID) … 続きを読む
VCRScore: Image captioning metric based on V\&L Transformers, CLIP, and precision-recall
要約 画像キャプションは、本質的なビジョンと言語研究のタスクになっています。 特 … 続きを読む
BAG: Body-Aligned 3D Wearable Asset Generation
要約 最近の進歩により、一般的な3D形状生成モデルで顕著な進歩が示されていますが … 続きを読む
Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis
要約 目的:外科的ワークフロー分析は、外科的効率と安全性を改善するために重要です … 続きを読む
The Linear Attention Resurrection in Vision Transformer
要約 Vision Transformers(VITS)は最近、コンピュータービ … 続きを読む
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
要約 画像キャプションは、コンピュータービジョンと自然言語処理の交差点における重 … 続きを読む
UDBE: Unsupervised Diffusion-based Brightness Enhancement in Underwater Images
要約 水中環境でのアクティビティは、いくつかのシナリオで最も重要であり、水中画像 … 続きを読む
Automatic Calibration of a Multi-Camera System with Limited Overlapping Fields of View for 3D Surgical Scene Reconstruction
要約 目的:この研究の目的は、3D外科シーン再建(3D-SSR)で使用されるマル … 続きを読む
カテゴリー: cs.CV
Automatic Calibration of a Multi-Camera System with Limited Overlapping Fields of View for 3D Surgical Scene Reconstruction はコメントを受け付けていません
SPECIAL: Zero-shot Hyperspectral Image Classification With CLIP
要約 Hyperspectral Image(HSI)分類は、HSIの各ピクセル … 続きを読む
カテゴリー: cs.CV
SPECIAL: Zero-shot Hyperspectral Image Classification With CLIP はコメントを受け付けていません
PDC-ViT : Source Camera Identification using Pixel Difference Convolution and Vision Transformer
要約 ソースカメラの識別は、テロ、暴力、その他の犯罪行為などの重要なケースを含む … 続きを読む
カテゴリー: cs.CV
PDC-ViT : Source Camera Identification using Pixel Difference Convolution and Vision Transformer はコメントを受け付けていません