-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Cognitive Disentanglement for Referring Multi-Object Tracking
要約 インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む
カテゴリー: cs.CV
Cognitive Disentanglement for Referring Multi-Object Tracking はコメントを受け付けていません
Prostate Cancer Screening with Artificial Intelligence-Enhanced Micro-Ultrasound: A Comparative Study with Traditional Methods
要約 背景と目的:Micro-Ultrasound(Micro-US)は、臨床的 … 続きを読む
AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping
要約 正確な作物マッピングは、個々のフィールドテクスチャから景観レベルのコンテキ … 続きを読む
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing
要約 大規模なマルチモダリティモデル(LMM)は、視覚的理解と生成に大きな進歩を … 続きを読む
カテゴリー: cs.CV
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing はコメントを受け付けていません
YOLO-SPCI: Enhancing Remote Sensing Object Detection via Selective-Perspective-Class Integration
要約 リモートセンシング画像のオブジェクト検出は、極端なスケールの変動、密なオブ … 続きを読む
カテゴリー: cs.CV
YOLO-SPCI: Enhancing Remote Sensing Object Detection via Selective-Perspective-Class Integration はコメントを受け付けていません
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment
要約 最新のシングルイメージスーパー解像度(SISR)モデルは、訓練されているス … 続きを読む
OrionBench: A Benchmark for Chart and Human-Recognizable Object Detection in Infographics
要約 科学、ビジネス、およびコミュニケーションのコンテキストにおけるチャートの中 … 続きを読む
Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning?
要約 COTの推論とトレーニング後のRLの最近の進歩は、MLLMのビデオ推論機能 … 続きを読む
カテゴリー: cs.CV
Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning? はコメントを受け付けていません
GeoLLaVA-8K: Scaling Remote-Sensing Multimodal Large Language Models to 8K Resolution
要約 超高解像度(UHR)リモートセンシング(RS)画像は、地球観測に貴重なデー … 続きを読む
カテゴリー: cs.CV
GeoLLaVA-8K: Scaling Remote-Sensing Multimodal Large Language Models to 8K Resolution はコメントを受け付けていません
Empowering Vector Graphics with Consistently Arbitrary Viewing and View-dependent Visibility
要約 この作品は、新しいテキストからベクトルへのグラフィック生成アプローチである … 続きを読む
カテゴリー: cs.CV
Empowering Vector Graphics with Consistently Arbitrary Viewing and View-dependent Visibility はコメントを受け付けていません