月別アーカイブ: 2024年4月

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

要約 VASA は、単一の静止画像とスピーチ オーディオ クリップを与えられて、 … 続きを読む

カテゴリー: cs.CV | VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time はコメントを受け付けていません

SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM

要約 高密度同時ローカライゼーションおよびマッピング (SLAM) は、ロボット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM はコメントを受け付けていません

StyleCity: Large-Scale 3D Urban Scenes Stylization with Vision-and-Text Reference via Progressive Optimization

要約 さまざまなスタイルを使用して大規模な仮想都市シーンを作成することは本質的に … 続きを読む

カテゴリー: cs.CV | StyleCity: Large-Scale 3D Urban Scenes Stylization with Vision-and-Text Reference via Progressive Optimization はコメントを受け付けていません

Generating Human Interaction Motions in Scenes with Text Control

要約 我々は、ノイズ除去拡散モデルに基づいてテキスト制御されたシーン認識モーショ … 続きを読む

カテゴリー: cs.CV, cs.GR | Generating Human Interaction Motions in Scenes with Text Control はコメントを受け付けていません

Efficient Conditional Diffusion Model with Probability Flow Sampling for Image Super-resolution

要約 画像の超解像度は、1 つの低解像度画像に対して複数の有効な高解像度画像が存 … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Conditional Diffusion Model with Probability Flow Sampling for Image Super-resolution はコメントを受け付けていません

MathWriting: A Dataset For Handwritten Mathematical Expression Recognition

要約 これまでで最大のオンライン手書き数式データセットである MathWriti … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | MathWriting: A Dataset For Handwritten Mathematical Expression Recognition はコメントを受け付けていません

ECLAIR: A High-Fidelity Aerial LiDAR Dataset for Semantic Segmentation

要約 点群セマンティック セグメンテーションの研究を進めるために特別に設計された … 続きを読む

カテゴリー: cs.CV | ECLAIR: A High-Fidelity Aerial LiDAR Dataset for Semantic Segmentation はコメントを受け付けていません

Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs

要約 最新のスマートフォンのカメラ品質は、キャプチャされた生の画像を強化する画像 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs はコメントを受け付けていません

VehicleGAN: Pair-flexible Pose Guided Image Synthesis for Vehicle Re-identification

要約 車両再識別 (Re-ID) は、過去 10 年間に広く研究されてきました。 … 続きを読む

カテゴリー: cs.CV | VehicleGAN: Pair-flexible Pose Guided Image Synthesis for Vehicle Re-identification はコメントを受け付けていません

Ghost-dil-NetVLAD: A Lightweight Neural Network for Visual Place Recognition

要約 視覚的場所認識 (VPR) は、膨大な計算コストと高い認識パフォーマンスの … 続きを読む

カテゴリー: cs.CV | Ghost-dil-NetVLAD: A Lightweight Neural Network for Visual Place Recognition はコメントを受け付けていません