cs.CV」カテゴリーアーカイブ

MCTrack: A Unified 3D Multi-Object Tracking Framework for Autonomous Driving

要約 このペーパーでは、KITTI、nuScenes、Waymo データセット全 … 続きを読む

カテゴリー: cs.CV | MCTrack: A Unified 3D Multi-Object Tracking Framework for Autonomous Driving はコメントを受け付けていません

Extracting Training Data from Unconditional Diffusion Models

要約 拡散確率モデル (DPM) が生成人工知能 (AI) の主流モデルとして採 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Extracting Training Data from Unconditional Diffusion Models はコメントを受け付けていません

Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies

要約 オーディオビジュアルディープフェイク検出に関する既存の方法は、オーディオデ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies はコメントを受け付けていません

PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion

要約 パノプティック リフティングは、2D パノプティック セグメンテーションを … 続きを読む

カテゴリー: cs.CV | PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion はコメントを受け付けていません

Transforming Game Play: A Comparative Study of DCQN and DTQN Architectures in Reinforcement Learning

要約 この研究では、3 つの異なる Atari ゲームにわたって畳み込みニューラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Transforming Game Play: A Comparative Study of DCQN and DTQN Architectures in Reinforcement Learning はコメントを受け付けていません

Cross-Modal Few-Shot Learning: a Generative Transfer Learning Framework

要約 少数ショット学習に関する既存の研究のほとんどは、同じモダリティからの少数の … 続きを読む

カテゴリー: cs.CV, cs.LG | Cross-Modal Few-Shot Learning: a Generative Transfer Learning Framework はコメントを受け付けていません

Both Ears Wide Open: Towards Language-Driven Spatial Audio Generation

要約 最近、普及モデルはモノチャンネルオーディオ生成において大きな成功を収めてい … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Both Ears Wide Open: Towards Language-Driven Spatial Audio Generation はコメントを受け付けていません

Sign Stitching: A Novel Approach to Sign Language Production

要約 手話言語制作 (SLP) は、利用可能なリソースが限られており、手話データ … 続きを読む

カテゴリー: cs.CL, cs.CV | Sign Stitching: A Novel Approach to Sign Language Production はコメントを受け付けていません

Enhancing Performance of Point Cloud Completion Networks with Consistency Loss

要約 点群補完ネットワークは従来、完成した点群と対応するグラウンドトゥルース間の … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Performance of Point Cloud Completion Networks with Consistency Loss はコメントを受け付けていません

TALK-Act: Enhance Textural-Awareness for 2D Speaking Avatar Reenactment with Diffusion Model

要約 最近、顔アニメーション技術の急速な発展により、2D 話すアバターが日常のシ … 続きを読む

カテゴリー: cs.CV, cs.GR | TALK-Act: Enhance Textural-Awareness for 2D Speaking Avatar Reenactment with Diffusion Model はコメントを受け付けていません