-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance
要約 世界には多様な素材が豊富にあり、それぞれが独特の表面外観を持ち、それらの特 … 続きを読む
カテゴリー: cs.CV
Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance はコメントを受け付けていません
Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring
要約 この研究では、時空間物体検出モデルの開発を通じて、UAV カメラを使用した … 続きを読む
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning
要約 モデルの規模が急速に拡大したため、微調整のために大量の計算リソースが必要に … 続きを読む
カテゴリー: cs.CV
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning はコメントを受け付けていません
Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything
要約 この研究は、効果的な病理学的画像分析のための教師あり学習を超えた新しいアプ … 続きを読む
カテゴリー: cs.CV
Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything はコメントを受け付けていません
Granular Privacy Control for Geolocation with Vision Language Models
要約 ビジョン言語モデル (VLM) は、情報を求める質問に答える機能が急速に進 … 続きを読む
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition
要約 教師なしドメイン適応 (UDA) は、特にトレーニング データとテスト デ … 続きを読む
カテゴリー: cs.CV
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition はコメントを受け付けていません
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations
要約 画像編集モデルは、オブジェクトの置換、属性やスタイルの変更、アクションや動 … 続きを読む
カテゴリー: cs.CV
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations はコメントを受け付けていません
Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts?
要約 少量の視覚データから新しいオブジェクトについて学習し、新しいシナリオにおけ … 続きを読む
カテゴリー: cs.CV
Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts? はコメントを受け付けていません
ActionCOMET: A Zero-shot Approach to Learn Image-specific Commonsense Concepts about Actions
要約 人間は、他の人間が実行しているさまざまな行動を(物理的に、またはビデオや画 … 続きを読む
カテゴリー: cs.CV
ActionCOMET: A Zero-shot Approach to Learn Image-specific Commonsense Concepts about Actions はコメントを受け付けていません
DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition
要約 災害評価における航空画像処理のための無人航空機 (UAV) と人工知能 ( … 続きを読む
カテゴリー: cs.CV
DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition はコメントを受け付けていません