月別アーカイブ: 2024年3月

T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image

要約 Pixel2Mesh (P2M) は、粗いメッシュから細かいメッシュへの変 … 続きを読む

カテゴリー: cs.CV | T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image はコメントを受け付けていません

View-Consistent 3D Editing with Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) の出現は 3D 編集に革命を … 続きを読む

カテゴリー: cs.CV, cs.GR | View-Consistent 3D Editing with Gaussian Splatting はコメントを受け付けていません

DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance

要約 振付師はダンスがどのようなものかを決定し、カメラマンはダンスの最終的なプレ … 続きを読む

カテゴリー: cs.CV, cs.MM | DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance はコメントを受け付けていません

Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet

要約 未破裂頭蓋内動脈瘤 (UIA) の正確な特定と定量化は、この脳血管障害のリ … 続きを読む

カテゴリー: cs.CV, eess.IV | Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet はコメントを受け付けていません

Poly Kernel Inception Network for Remote Sensing Detection

要約 リモート センシング画像 (RSI) での物体検出は、物体のスケールの大き … 続きを読む

カテゴリー: cs.CV | Poly Kernel Inception Network for Remote Sensing Detection はコメントを受け付けていません

Retina Vision Transformer (RetinaViT): Introducing Scaled Patches into Vision Transformers

要約 人間は低空間周波数成分と高空間周波数成分を同時に認識し、両方からの情報を組 … 続きを読む

カテゴリー: cs.CV | Retina Vision Transformer (RetinaViT): Introducing Scaled Patches into Vision Transformers はコメントを受け付けていません

AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts

要約 音声データと視覚データの両方の相乗効果を活用することは、特に自然環境におい … 続きを読む

カテゴリー: cs.CV | AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts はコメントを受け付けていません

Step-Calibrated Diffusion for Biomedical Optical Image Restoration

要約 高品質、高解像度の医用画像処理は臨床ケアに不可欠です。 ラマンベースの生物 … 続きを読む

カテゴリー: cs.CV, eess.IV | Step-Calibrated Diffusion for Biomedical Optical Image Restoration はコメントを受け付けていません

DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses

要約 2 つの画像間の物体の相対的な姿勢を決定することは、一般化可能な物体の姿勢 … 続きを読む

カテゴリー: cs.CV, cs.RO | DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses はコメントを受け付けていません

SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning

要約 Generalized Category Discovery (GCD) … 続きを読む

カテゴリー: cs.AI, cs.CV | SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning はコメントを受け付けていません