-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers
要約 近年のディープラーニング技術の進歩により、マルチモーダルな医療データに基づ … 続きを読む
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming
要約 現在のマルチモーダル大規模言語モデル(MLLM)は、文書画像に典型的な高解 … 続きを読む
カテゴリー: cs.CV
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming はコメントを受け付けていません
Image-Based Virtual Try-On: A Survey
要約 画像ベースのバーチャル試着は、自然な服装をした人物の画像と衣服の画像を合成 … 続きを読む
カテゴリー: cs.CV
Image-Based Virtual Try-On: A Survey はコメントを受け付けていません
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation
要約 現在の弱教師付き逐次学習によるセマンティックセグメンテーション(WILSS … 続きを読む
カテゴリー: cs.CV
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation はコメントを受け付けていません
Correlation-Embedded Transformer Tracking: A Single-Branch Framework
要約 ロバストで識別可能な外観モデルの開発は、視覚物体追跡における長年の研究課題 … 続きを読む
カテゴリー: cs.CV
Correlation-Embedded Transformer Tracking: A Single-Branch Framework はコメントを受け付けていません
White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?
要約 本論文では、表現学習の自然な目的は、データの分布、例えばトークンの集合を、 … 続きを読む
PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning
要約 変換器は点群学習タスクに革命をもたらしたが、2次関数的な複雑さが長いシーケ … 続きを読む
カテゴリー: cs.CV
PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning はコメントを受け付けていません
RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation
要約 セグメント何でもモデル(Segment Anything Model: S … 続きを読む
Deep Learning for Computer Vision based Activity Recognition and Fall Detection of the Elderly: a Systematic Review
要約 先進国における高齢者の割合が世界的に増加するにつれ、この集団の健康管理、特 … 続きを読む
カテゴリー: cs.CV
Deep Learning for Computer Vision based Activity Recognition and Fall Detection of the Elderly: a Systematic Review はコメントを受け付けていません
Learning Exposure Correction in Dynamic Scenes
要約 露出補正は、不適切な露出に起因する視覚データを補正することを目的としており … 続きを読む
カテゴリー: cs.CV
Learning Exposure Correction in Dynamic Scenes はコメントを受け付けていません