cs.CV」カテゴリーアーカイブ

StereoCrafter-Zero: Zero-Shot Stereo Video Generation with Noisy Restart

要約 人間の両眼視を模倣した高品質のステレオ ビデオを生成するには、フレーム全体 … 続きを読む

カテゴリー: cs.CV | StereoCrafter-Zero: Zero-Shot Stereo Video Generation with Noisy Restart はコメントを受け付けていません

SplatR : Experience Goal Visual Rearrangement with 3D Gaussian Splatting and Dense Feature Matching

要約 エクスペリエンス目標の視覚的再配置タスクは、Embedded AI 内の基 … 続きを読む

カテゴリー: cs.CV, cs.RO | SplatR : Experience Goal Visual Rearrangement with 3D Gaussian Splatting and Dense Feature Matching はコメントを受け付けていません

Layer Pruning with Consensus: A Triple-Win Solution

要約 レイヤー プルーニングは、標準的な構造化プルーニングに代わる有望な代替手段 … 続きを読む

カテゴリー: cs.CV, cs.LG | Layer Pruning with Consensus: A Triple-Win Solution はコメントを受け付けていません

DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding

要約 本稿では、IDEA Research が開発したこれまでで最高のオープンワ … 続きを読む

カテゴリー: cs.CV | DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding はコメントを受け付けていません

Enhancing Medical Image Segmentation with Deep Learning and Diffusion Models

要約 医用画像のセグメンテーションは正確な臨床診断に不可欠ですが、病変と正常組織 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Enhancing Medical Image Segmentation with Deep Learning and Diffusion Models はコメントを受け付けていません

Contrasting local and global modeling with machine learning and satellite data: A case study estimating tree canopy height in African savannas

要約 衛星画像を使用した機械学習 (SatML) の進歩により、地球規模での環境 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Contrasting local and global modeling with machine learning and satellite data: A case study estimating tree canopy height in African savannas はコメントを受け付けていません

InCrowd-VI: A Realistic Visual-Inertial Dataset for Evaluating SLAM in Indoor Pedestrian-Rich Spaces for Human Navigation

要約 同時位置特定とマッピング (SLAM) 技術を使用して視覚障害者をナビゲー … 続きを読む

カテゴリー: cs.CV, cs.RO | InCrowd-VI: A Realistic Visual-Inertial Dataset for Evaluating SLAM in Indoor Pedestrian-Rich Spaces for Human Navigation はコメントを受け付けていません

Localizing Events in Videos with Multimodal Queries

要約 ビデオ検索などのユーザー指向アプリケーションの重要性が高まる中、セマンティ … 続きを読む

カテゴリー: cs.AI, cs.CV | Localizing Events in Videos with Multimodal Queries はコメントを受け付けていません

Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning

要約 ビジョン言語モデル (VLM) は、幅広い下流タスクにわたって優れたパフォ … 続きを読む

カテゴリー: cs.CL, cs.CV | Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning はコメントを受け付けていません

Using Formal Models, Safety Shields and Certified Control to Validate AI-Based Train Systems

要約 自律システムの認証は、科学と産業において重要な関心事です。 KI-LOK … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LO | Using Formal Models, Safety Shields and Certified Control to Validate AI-Based Train Systems はコメントを受け付けていません