-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Visual Prompt Engineering for Medical Vision Language Models in Radiology
要約 放射線医学における医療画像の分類は、特に目に見えない病理を一般化する際に、 … 続きを読む
カテゴリー: cs.CV
Visual Prompt Engineering for Medical Vision Language Models in Radiology はコメントを受け付けていません
Object Detection for Vehicle Dashcams using Transformers
要約 インテリジェントオートメーションはドライバーや車両管理会社を支援し、生産性 … 続きを読む
Multi-view Pose Fusion for Occlusion-Aware 3D Human Pose Estimation
要約 人間とロボットの安全かつ効果的なコラボレーションを確保するには、堅牢な 3 … 続きを読む
DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries
要約 LiDAR パノプティック セグメンテーションは、物やもののクラスのインス … 続きを読む
カテゴリー: cs.CV
DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries はコメントを受け付けていません
Mining Field Data for Tree Species Recognition at Scale
要約 個々の樹種のラベルは、必要な専門知識と写真判読の限界により、取得することが … 続きを読む
カテゴリー: cs.CV
Mining Field Data for Tree Species Recognition at Scale はコメントを受け付けていません
u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、主に洗練 … 続きを読む
カテゴリー: cs.CV
u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model はコメントを受け付けていません
Benchmarking foundation models as feature extractors for weakly-supervised computational pathology
要約 人工知能の進歩により、臨床関連情報を抽出できる多数の病理学基礎モデルの開発 … 続きを読む
SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization
要約 Extreme Multimodal Summarization with … 続きを読む
Network transferability of adversarial patches in real-time object detection
要約 コンピューター ビジョンの敵対的パッチを使用すると、ディープ ニューラル … 続きを読む
カテゴリー: cs.CV
Network transferability of adversarial patches in real-time object detection はコメントを受け付けていません
Shot Segmentation Based on Von Neumann Entropy for Key Frame Extraction
要約 ビデオのキーフレーム抽出は、ビデオの要約、検索、圧縮などのさまざまな分野で … 続きを読む