月別アーカイブ: 2024年3月

T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image

投稿日: 2024年3月21日作成者: jarxiv

要約 Pixel2Mesh (P2M) は、粗いメッシュから細かいメッシュへの変 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

View-Consistent 3D Editing with Gaussian Splatting

投稿日: 2024年3月21日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) の出現は 3D 編集に革命を … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance

投稿日: 2024年3月21日作成者: jarxiv

要約振付師はダンスがどのようなものかを決定し、カメラマンはダンスの最終的なプレ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet

投稿日: 2024年3月21日作成者: jarxiv

要約未破裂頭蓋内動脈瘤 (UIA) の正確な特定と定量化は、この脳血管障害のリ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Poly Kernel Inception Network for Remote Sensing Detection

投稿日: 2024年3月21日作成者: jarxiv

要約リモートセンシング画像 (RSI) での物体検出は、物体のスケールの大き … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Retina Vision Transformer (RetinaViT): Introducing Scaled Patches into Vision Transformers

投稿日: 2024年3月21日作成者: jarxiv

要約人間は低空間周波数成分と高空間周波数成分を同時に認識し、両方からの情報を組 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts

投稿日: 2024年3月21日作成者: jarxiv

要約音声データと視覚データの両方の相乗効果を活用することは、特に自然環境におい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Step-Calibrated Diffusion for Biomedical Optical Image Restoration

投稿日: 2024年3月21日作成者: jarxiv

要約高品質、高解像度の医用画像処理は臨床ケアに不可欠です。ラマンベースの生物 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses

投稿日: 2024年3月21日作成者: jarxiv

要約 2 つの画像間の物体の相対的な姿勢を決定することは、一般化可能な物体の姿勢 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning

投稿日: 2024年3月21日作成者: jarxiv

要約 Generalized Category Discovery (GCD) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年3月

T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image

View-Consistent 3D Editing with Gaussian Splatting

DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance

Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet

Poly Kernel Inception Network for Remote Sensing Detection

Retina Vision Transformer (RetinaViT): Introducing Scaled Patches into Vision Transformers

AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts

Step-Calibrated Diffusion for Biomedical Optical Image Restoration

DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses

SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning

最近の投稿

最近のコメント

アーカイブ

カテゴリー