月別アーカイブ: 2024年9月

Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM

投稿日: 2024年9月26日作成者: jarxiv

要約 3D ガウススプラッティング SLAM を利用して、シーン表現内にオブジ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | コメントを受け付けていません

Face Forgery Detection with Elaborate Backbone

投稿日: 2024年9月26日作成者: jarxiv

要約顔偽造検出 (FFD)、またはディープフェイク検出は、デジタル顔が本物か偽 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NTIRE 2024 Challenge on Stereo Image Super-Resolution: Methods and Results

投稿日: 2024年9月26日作成者: jarxiv

要約この文書では、新しいソリューションと結果に焦点を当てて、ステレオ画像超解像 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering

投稿日: 2024年9月26日作成者: jarxiv

要約点群は、新興の AR/VR アプリケーションにおけるボリュームストリーミ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling

投稿日: 2024年9月26日作成者: jarxiv

要約このペーパーでは、データ不足のシナリオに固有の課題に対処するために、大規模 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration

投稿日: 2024年9月26日作成者: jarxiv

要約イベントカメラは、強度の変化を非同期でキャプチャし、高い時間分解能などの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos

投稿日: 2024年9月26日作成者: jarxiv

要約教育ビデオでの手順計画には、初期状態と目標状態の視覚的観察に基づいて一連の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning

投稿日: 2024年9月26日作成者: jarxiv

要約自律型ロボットは、その効率性と人件費の低さから、いくつかのマッピングやデー … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

投稿日: 2024年9月26日作成者: jarxiv

要約大規模なテキストから画像への生成モデルの最近の進歩にもかかわらず、これらの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Single Image, Any Face: Generalisable 3D Face Generation

投稿日: 2024年9月26日作成者: jarxiv

要約単一の制約のない画像から 3D 人間の顔のアバターを作成することは、数多く … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年9月

Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM

Face Forgery Detection with Elaborate Backbone

NTIRE 2024 Challenge on Stereo Image Super-Resolution: Methods and Results

Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering

DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling

Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration

RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos

Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning

Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

Single Image, Any Face: Generalisable 3D Face Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー