cs.CV」カテゴリーアーカイブ

GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection

要約 LIDARベースの3D検出器には、トレーニングのために大きなデータセットが … 続きを読む

カテゴリー: cs.CV | GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection はコメントを受け付けていません

Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark

要約 大規模なマルチモーダルモデル(LMM)は、単一の画像に対して視覚的な質問を … 続きを読む

カテゴリー: cs.CV | Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark はコメントを受け付けていません

Rethinking Diffusion Model in High Dimension

要約 次元の呪いは、統計的確率モデルでは避けられない課題ですが、拡散モデルはこの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Rethinking Diffusion Model in High Dimension はコメントを受け付けていません

MF-VITON: High-Fidelity Mask-Free Virtual Try-On with Minimal Input

要約 Virtual Try-On(VITON)の最近の進歩により、強力なテキス … 続きを読む

カテゴリー: cs.CV | MF-VITON: High-Fidelity Mask-Free Virtual Try-On with Minimal Input はコメントを受け付けていません

TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On

要約 Virtual Try-On(VTO)の最近の進歩は、現実的な画像を生成し … 続きを読む

カテゴリー: cs.CV | TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On はコメントを受け付けていません

Task-Oriented Co-Design of Communication, Computing, and Control for Edge-Enabled Industrial Cyber-Physical Systems

要約 このペーパーでは、ミッションクリティカルな産業サイバー物理システム(CPS … 続きを読む

カテゴリー: cs.CV, cs.IT, eess.IV, math.IT | Task-Oriented Co-Design of Communication, Computing, and Control for Edge-Enabled Industrial Cyber-Physical Systems はコメントを受け付けていません

Generating Robot Constitutions & Benchmarks for Semantic Safety

要約 最近まで、ロボットの安全研究は、主に衝突回避とロボットのすぐ近くの危険の減 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.HC, cs.RO | Generating Robot Constitutions & Benchmarks for Semantic Safety はコメントを受け付けていません

MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention

要約 マルチビュー拡散モデルは、一般的なオブジェクトの画像から3Dの生成でかなり … 続きを読む

カテゴリー: cs.AI, cs.CV | MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention はコメントを受け付けていません

REGEN: Learning Compact Video Embedding with (Re-)Generative Decoder

要約 生成モデリングのためのビデオ埋め込み装置の学習に関する新しい視点を提示しま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | REGEN: Learning Compact Video Embedding with (Re-)Generative Decoder はコメントを受け付けていません

SSVQ: Unleashing the Potential of Vector Quantization with Sign-Splitting

要約 ベクター量子化(VQ)は、特に極端な圧縮シナリオでは、多様なモデル全体で均 … 続きを読む

カテゴリー: cs.CV | SSVQ: Unleashing the Potential of Vector Quantization with Sign-Splitting はコメントを受け付けていません