-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning
要約 この研究では、豊富なラベルのない本当の顔を使って、一般化パフォーマンスに関 … 続きを読む
EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation
要約 オープンボキャブラリーのパノプティックセグメンテーションは、境界のないボキ … 続きを読む
カテゴリー: cs.CV
EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation はコメントを受け付けていません
A LoRA is Worth a Thousand Pictures
要約 拡散モデルとパラメータ効率の良い微調整 (PEFT) の最近の進歩により、 … 続きを読む
カテゴリー: cs.CV
A LoRA is Worth a Thousand Pictures はコメントを受け付けていません
Exploring Semantic Consistency and Style Diversity for Domain Generalized Semantic Segmentation
要約 ドメイン一般化セマンティック セグメンテーション (DGSS) は、ソース … 続きを読む
カテゴリー: cs.CV
Exploring Semantic Consistency and Style Diversity for Domain Generalized Semantic Segmentation はコメントを受け付けていません
SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework
要約 分光光音響 (sPA) イメージングでは、複数の波長を使用して、発色団をそ … 続きを読む
カテゴリー: cs.CV
SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework はコメントを受け付けていません
CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding
要約 マルチモーダル大規模言語モデル (MLLM) の既存のビデオ理解ベンチマー … 続きを読む
カテゴリー: cs.CV
CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding はコメントを受け付けていません
CPath-Omni: A Unified Multimodal Foundation Model for Patch and Whole Slide Image Analysis in Computational Pathology
要約 大規模マルチモーダル モデル (LMM) の出現により、病理学に大きな進歩 … 続きを読む
カテゴリー: cs.CV
CPath-Omni: A Unified Multimodal Foundation Model for Patch and Whole Slide Image Analysis in Computational Pathology はコメントを受け付けていません
UniLoc: Towards Universal Place Recognition Using Any Single Modality
要約 現在までのところ、ほとんどの場所認識方法は単一モダリティの検索に焦点を当て … 続きを読む
カテゴリー: cs.CV
UniLoc: Towards Universal Place Recognition Using Any Single Modality はコメントを受け付けていません
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations
要約 画像から幾何学的情報や材質情報を取得することは、コンピューター ビジョンと … 続きを読む
カテゴリー: cs.CV
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations はコメントを受け付けていません
Probing the Mid-level Vision Capabilities of Self-Supervised Learning
要約 一般的なオブジェクトの位置特定や 3D 幾何学的な理解などの中レベルの視覚 … 続きを読む
カテゴリー: cs.CV
Probing the Mid-level Vision Capabilities of Self-Supervised Learning はコメントを受け付けていません