cs.CV」カテゴリーアーカイブ

LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS

要約 ポイントベースの技術を使用したリアルタイム ニューラル レンダリングの最近 … 続きを読む

カテゴリー: cs.CV | LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS はコメントを受け付けていません

LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models

要約 物理的推論は、現実世界で動作するロボット エージェントに必要な重要なスキル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models はコメントを受け付けていません

GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

要約 3D コンテンツの生成は大幅に進歩しましたが、既存の方法は入力形式、潜在空 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation はコメントを受け付けていません

Scaling Properties of Diffusion Models for Perceptual Tasks

要約 この論文では、拡散モデルを使用した反復計算が、生成タスクだけでなく視覚認識 … 続きを読む

カテゴリー: cs.AI, cs.CV | Scaling Properties of Diffusion Models for Perceptual Tasks はコメントを受け付けていません

Material Transforms from Disentangled NeRF Representations

要約 この論文では、最初に、異なるシーン間でマテリアルの変換を転送するための新し … 続きを読む

カテゴリー: cs.CV, cs.GR | Material Transforms from Disentangled NeRF Representations はコメントを受け付けていません

WavShadow: Wavelet Based Shadow Segmentation and Removal

要約 影の除去とセグメンテーションは、コンピュータ ビジョン、特に複雑な現実世界 … 続きを読む

カテゴリー: cs.CV | WavShadow: Wavelet Based Shadow Segmentation and Removal はコメントを受け付けていません

Extreme Rotation Estimation in the Wild

要約 我々は、画像の視野が限られている、または重複していない極端な設定で撮影され … 続きを読む

カテゴリー: cs.CV | Extreme Rotation Estimation in the Wild はコメントを受け付けていません

Reminding Multimodal Large Language Models of Object-aware Knowledge with Retrieved Tags

要約 マルチモーダル大規模言語モデル (MLLM) の一般的な視覚的命令追従能力 … 続きを読む

カテゴリー: cs.CL, cs.CV | Reminding Multimodal Large Language Models of Object-aware Knowledge with Retrieved Tags はコメントを受け付けていません

Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models

要約 テキストの指示に基づいて画像にオブジェクトを追加することは、セマンティック … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models はコメントを受け付けていません

Few-shot Semantic Learning for Robust Multi-Biome 3D Semantic Mapping in Off-Road Environments

要約 オフロード環境では、構造化されていない地形、センシング条件の悪化、バイオー … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Few-shot Semantic Learning for Robust Multi-Biome 3D Semantic Mapping in Off-Road Environments はコメントを受け付けていません