cs.CV」カテゴリーアーカイブ

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

要約 データ表現の選択は、幾何学的タスクにおける深層学習の成功の重要な要素です。 … 続きを読む

カテゴリー: cs.CV | DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません

UnZipLoRA: Separating Content and Style from a Single Image

要約 このペーパーでは、画像をその構成要素である主題とスタイルに分解する手法であ … 続きを読む

カテゴリー: cs.CV | UnZipLoRA: Separating Content and Style from a Single Image はコメントを受け付けていません

VisionZip: Longer is Better but Not Necessary in Vision Language Models

要約 ビジョン言語モデルの最近の進歩により、ビジュアル トークンの長さがテキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | VisionZip: Longer is Better but Not Necessary in Vision Language Models はコメントを受け付けていません

QUEEN: QUantized Efficient ENcoding of Dynamic Gaussians for Streaming Free-viewpoint Videos

要約 オンラインの自由視点ビデオ (FVV) ストリーミングは、比較的研究が進ん … 続きを読む

カテゴリー: cs.AI, cs.CV | QUEEN: QUantized Efficient ENcoding of Dynamic Gaussians for Streaming Free-viewpoint Videos はコメントを受け付けていません

NVILA: Efficient Frontier Visual Language Models

要約 近年、視覚言語モデル (VLM) の精度が大幅に向上しました。 しかし、そ … 続きを読む

カテゴリー: cs.CV | NVILA: Efficient Frontier Visual Language Models はコメントを受け付けていません

Turbo3D: Ultra-fast Text-to-3D Generation

要約 Turbo3D は、1 秒未満で高品質のガウス スプラッティング アセット … 続きを読む

カテゴリー: cs.CV | Turbo3D: Ultra-fast Text-to-3D Generation はコメントを受け付けていません

PaintScene4D: Consistent 4D Scene Generation from Text Prompts

要約 拡散モデルの最近の進歩は 2D および 3D コンテンツの作成に革命をもた … 続きを読む

カテゴリー: cs.AI, cs.CV | PaintScene4D: Consistent 4D Scene Generation from Text Prompts はコメントを受け付けていません

Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail

要約 Stereo Anywhere は、幾何学的制約と単眼深度ビジョン基盤モデ … 続きを読む

カテゴリー: cs.CV | Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail はコメントを受け付けていません

A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks

要約 歩行認識は、特に他の生理学的生体認証が非実用的または無効であるシナリオにお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks はコメントを受け付けていません

Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks

要約 オープンワールド環境でタスクを実行するように自然言語で指示できる身体支援エ … 続きを読む

カテゴリー: cs.CV, cs.RO | Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks はコメントを受け付けていません