-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Integrating Features for Recognizing Human Activities through Optimized Parameters in Graph Convolutional Networks and Transformer Architectures
要約 人間の活動認識は、コンピューター ビジョン、マシン ビジョン、ディープラー … 続きを読む
CogVLM2: Visual Language Models for Image and Video Understanding
要約 VisualGLM と CogVLM を皮切りに、視覚と言語の融合の強化、 … 続きを読む
カテゴリー: cs.CV
CogVLM2: Visual Language Models for Image and Video Understanding はコメントを受け付けていません
UAV-Based Human Body Detector Selection and Fusion for Geolocated Saliency Map Generation
要約 ソフト リアルタイムでさまざまなクラスの物体を確実に検出し地理位置特定する … 続きを読む
Locally Grouped and Scale-Guided Attention for Dense Pest Counting
要約 この研究では、デジタルトラップで捕獲された密集して分布する害虫を予測するた … 続きを読む
カテゴリー: cs.CV
Locally Grouped and Scale-Guided Attention for Dense Pest Counting はコメントを受け付けていません
A Simple and Generalist Approach for Panoptic Segmentation
要約 ジェネラリスト ビジョン モデルは、さまざまなビジョン タスクに対応する … 続きを読む
カテゴリー: cs.CV
A Simple and Generalist Approach for Panoptic Segmentation はコメントを受け付けていません
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation
要約 キャラクター アニメーションは、コンピュータ グラフィックスとビジョンの変 … 続きを読む
カテゴリー: cs.CV
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation はコメントを受け付けていません
Learning to Detect and Segment for Open Vocabulary Object Detection
要約 オープンボキャブラリーのオブジェクト検出は、視覚言語の事前トレーニング済み … 続きを読む
カテゴリー: cs.CV
Learning to Detect and Segment for Open Vocabulary Object Detection はコメントを受け付けていません
VideoMambaPro: A Leap Forward for Mamba in Video Understanding
要約 ビデオを理解するには、豊かな時空間表現を抽出する必要があります。これは、ト … 続きを読む
カテゴリー: cs.CV
VideoMambaPro: A Leap Forward for Mamba in Video Understanding はコメントを受け付けていません
On Feasibility of Intent Obfuscating Attacks
要約 意図の難読化は、敵対的な状況における一般的な戦術であり、攻撃者がターゲット … 続きを読む
Towards Modality-agnostic Label-efficient Segmentation with Entropy-Regularized Distribution Alignment
要約 ラベル効率の良いセグメンテーションは、トレーニングにまばらで限られたグラウ … 続きを読む
カテゴリー: cs.CV
Towards Modality-agnostic Label-efficient Segmentation with Entropy-Regularized Distribution Alignment はコメントを受け付けていません