月別アーカイブ: 2025年1月

CCESAR: Coastline Classification-Extraction From SAR Images Using CNN-U-Net Combination

要約 この記事では、画像分類とそれに続くセグメンテーションを含む 2 段階のモデ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | CCESAR: Coastline Classification-Extraction From SAR Images Using CNN-U-Net Combination はコメントを受け付けていません

InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling

要約 このペーパーは、ロング アンド リッチ コンテキスト (LRC) モデリン … 続きを読む

カテゴリー: cs.CV | InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling はコメントを受け付けていません

Continuous 3D Perception Model with Persistent State

要約 幅広い 3D タスクを解決できる統合フレームワークを紹介します。 私たちの … 続きを読む

カテゴリー: cs.CV | Continuous 3D Perception Model with Persistent State はコメントを受け付けていません

Taming Teacher Forcing for Masked Autoregressive Video Generation

要約 フレーム内生成のためのマスクされたモデリングと次のフレーム生成のための因果 … 続きを読む

カテゴリー: cs.CV | Taming Teacher Forcing for Masked Autoregressive Video Generation はコメントを受け付けていません

GPS as a Control Signal for Image Generation

要約 写真メタデータに含まれる GPS タグが画像生成に有用な制御信号を提供する … 続きを読む

カテゴリー: cs.CV | GPS as a Control Signal for Image Generation はコメントを受け付けていません

Learning segmentation from point trajectories

要約 私たちは、他の形式の監視ではなく、動きに基づいてビデオ内のオブジェクトをセ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learning segmentation from point trajectories はコメントを受け付けていません

Towards Affordance-Aware Articulation Synthesis for Rigged Objects

要約 リグ付きオブジェクトは、さまざまなシーンや姿勢に柔軟に適応できるため、アー … 続きを読む

カテゴリー: cs.CV | Towards Affordance-Aware Articulation Synthesis for Rigged Objects はコメントを受け付けていません

FoundationStereo: Zero-Shot Stereo Matching

要約 ドメインごとの微調整により、ベンチマーク データセットで優れたディープ ス … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | FoundationStereo: Zero-Shot Stereo Matching はコメントを受け付けていません

GSTAR: Gaussian Surface Tracking and Reconstruction

要約 3D ガウス スプラッティング技術により、静的シーンの効率的な写真のように … 続きを読む

カテゴリー: cs.CV | GSTAR: Gaussian Surface Tracking and Reconstruction はコメントを受け付けていません

Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications

要約 SLAM は、ロボット工学や AR/VR に幅広く応用できる基礎的な技術で … 続きを読む

カテゴリー: cs.CV, cs.RO | Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications はコメントを受け付けていません