-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年9月
The Impact of Print-Scanning in Heterogeneous Morph Evaluation Scenarios
要約 フェイスモーフィング攻撃は、顔認識(FR)システムにとってますます脅威とな … 続きを読む
カテゴリー: cs.CV
The Impact of Print-Scanning in Heterogeneous Morph Evaluation Scenarios はコメントを受け付けていません
Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach
要約 G2A-VReIDは、185,907の画像と5,576のトラックレットから … 続きを読む
カテゴリー: cs.CV
Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach はコメントを受け付けていません
TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation
要約 コントラスト言語画像事前学習(CLIP)は、最近ピクセルレベルのゼロショッ … 続きを読む
カテゴリー: cs.CV
TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation はコメントを受け付けていません
Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection
要約 弱教師付きビデオ異常検出(WS-VAD)のほとんどのモデルは、異常のタイプ … 続きを読む
カテゴリー: cs.CV
Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection はコメントを受け付けていません
Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers
要約 近年のディープラーニング技術の進歩により、マルチモーダルな医療データに基づ … 続きを読む
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming
要約 現在のマルチモーダル大規模言語モデル(MLLM)は、文書画像に典型的な高解 … 続きを読む
カテゴリー: cs.CV
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming はコメントを受け付けていません
Image-Based Virtual Try-On: A Survey
要約 画像ベースのバーチャル試着は、自然な服装をした人物の画像と衣服の画像を合成 … 続きを読む
カテゴリー: cs.CV
Image-Based Virtual Try-On: A Survey はコメントを受け付けていません
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation
要約 現在の弱教師付き逐次学習によるセマンティックセグメンテーション(WILSS … 続きを読む
カテゴリー: cs.CV
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation はコメントを受け付けていません
Correlation-Embedded Transformer Tracking: A Single-Branch Framework
要約 ロバストで識別可能な外観モデルの開発は、視覚物体追跡における長年の研究課題 … 続きを読む
カテゴリー: cs.CV
Correlation-Embedded Transformer Tracking: A Single-Branch Framework はコメントを受け付けていません
White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?
要約 本論文では、表現学習の自然な目的は、データの分布、例えばトークンの集合を、 … 続きを読む