月別アーカイブ: 2024年9月

Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM

要約 3D ガウス スプラッティング SLAM を利用して、シーン表現内にオブジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM はコメントを受け付けていません

Face Forgery Detection with Elaborate Backbone

要約 顔偽造検出 (FFD)、またはディープフェイク検出は、デジタル顔が本物か偽 … 続きを読む

カテゴリー: cs.CV | Face Forgery Detection with Elaborate Backbone はコメントを受け付けていません

NTIRE 2024 Challenge on Stereo Image Super-Resolution: Methods and Results

要約 この文書では、新しいソリューションと結果に焦点を当てて、ステレオ画像超解像 … 続きを読む

カテゴリー: cs.CV | NTIRE 2024 Challenge on Stereo Image Super-Resolution: Methods and Results はコメントを受け付けていません

Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering

要約 点群は、新興の AR/VR アプリケーションにおけるボリューム ストリーミ … 続きを読む

カテゴリー: cs.CV, eess.IV | Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering はコメントを受け付けていません

DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling

要約 このペーパーでは、データ不足のシナリオに固有の課題に対処するために、大規模 … 続きを読む

カテゴリー: cs.CV | DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling はコメントを受け付けていません

Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration

要約 イベント カメラは、強度の変化を非同期でキャプチャし、高い時間分解能などの … 続きを読む

カテゴリー: cs.CV | Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration はコメントを受け付けていません

RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos

要約 教育ビデオでの手順計画には、初期状態と目標状態の視覚的観察に基づいて一連の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos はコメントを受け付けていません

Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning

要約 自律型ロボットは、その効率性と人件費の低さから、いくつかのマッピングやデー … 続きを読む

カテゴリー: cs.CV, cs.RO | Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning はコメントを受け付けていません

Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

要約 大規模なテキストから画像への生成モデルの最近の進歩にもかかわらず、これらの … 続きを読む

カテゴリー: cs.CV | Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing はコメントを受け付けていません

Single Image, Any Face: Generalisable 3D Face Generation

要約 単一の制約のない画像から 3D 人間の顔のアバターを作成することは、数多く … 続きを読む

カテゴリー: cs.CV | Single Image, Any Face: Generalisable 3D Face Generation はコメントを受け付けていません