-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
GarmentTracking: Category-Level Garment Pose Tracking
要約 衣服は人間にとって重要です。 完全な衣服のポーズを推定および追跡できる視覚 … 続きを読む
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning
要約 このペーパーでは、マルチモーダル大手言語モデル(MLLM)のルールベースの … 続きを読む
カテゴリー: cs.CV
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning はコメントを受け付けていません
Autoregressive Distillation of Diffusion Transformers
要約 トランスアーキテクチャを備えた拡散モデルは、高忠実度の画像と高解像度のスケ … 続きを読む
カテゴリー: cs.CV
Autoregressive Distillation of Diffusion Transformers はコメントを受け付けていません
Cognitive Disentanglement for Referring Multi-Object Tracking
要約 インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む
カテゴリー: cs.CV
Cognitive Disentanglement for Referring Multi-Object Tracking はコメントを受け付けていません
EchoMask: Speech-Queried Attention-based Mask Modeling for Holistic Co-Speech Motion Generation
要約 マスクされたモデリングフレームワークは、共和声モーション生成に有望を示して … 続きを読む
CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection
要約 木材処理産業の品質管理を確保するには、木材の欠陥検出が重要です。 ただし、 … 続きを読む
Context-Aware Palmprint Recognition via a Relative Similarity Metric
要約 既存のマッチングフレームワークの堅牢性と識別性を高める相対類似性メトリック … 続きを読む
カテゴリー: cs.CV
Context-Aware Palmprint Recognition via a Relative Similarity Metric はコメントを受け付けていません
Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks
要約 速度(SOS)は組織の生体力学的特性であり、そのイメージングは診断のた … 続きを読む
カテゴリー: cs.CV
Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks はコメントを受け付けていません
Big Brother is Watching: Proactive Deepfake Detection via Learnable Hidden Face
要約 Deepfake Technologiesが進歩し続けるにつれて、受動的検 … 続きを読む
カテゴリー: cs.CV
Big Brother is Watching: Proactive Deepfake Detection via Learnable Hidden Face はコメントを受け付けていません
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild
要約 このレポートは、CVPR 2025と協力して開催されたWild(PVU)チ … 続きを読む
カテゴリー: cs.CV
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild はコメントを受け付けていません