「cs.CV」カテゴリーアーカイブ

Click2Mask: Local Editing with Dynamic Mask Generation

投稿日: 2025年1月9日作成者: jarxiv

要約生成モデルの最近の進歩により、画像の生成と編集に革命が起こり、専門家でなく … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

MADation: Face Morphing Attack Detection with Foundation Models

投稿日: 2025年1月9日作成者: jarxiv

要約近年、顔認識アルゴリズムのパフォーマンスが大幅に向上しているにもかかわらず … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

投稿日: 2025年1月9日作成者: jarxiv

要約急速な発展が見られる一方で、リモートセンシングによる物体検出は依然として高 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cosmos World Foundation Model Platform for Physical AI

投稿日: 2025年1月8日作成者: jarxiv

要約物理的な AI は、まずデジタルでトレーニングする必要があります。それ自 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

VTAO-BiManip: Masked Visual-Tactile-Action Pre-training with Object Understanding for Bimanual Dexterous Manipulation

投稿日: 2025年1月8日作成者: jarxiv

要約両手の器用な操作は、それぞれの手の自由度とその調整が高いため、ロボット工学 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

MULTI: Multimodal Understanding Leaderboard with Text and Images

投稿日: 2025年1月8日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の急速な発展により、それらが … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Materialist: Physically Based Editing Using Single-Image Inverse Rendering

投稿日: 2025年1月8日作成者: jarxiv

要約シングルビューの逆物理ベースレンダリングに基づいて画像編集を実行するため … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Self-adaptive vision-language model for 3D segmentation of pulmonary artery and vein

投稿日: 2025年1月8日作成者: jarxiv

要約肺構造の正確なセグメンテーションは、臨床診断、疾患研究、治療計画において非 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction

投稿日: 2025年1月8日作成者: jarxiv

要約磁気共鳴画像法 (MRI) は臨床現場で広く使用されていますが、取得時間が … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection

投稿日: 2025年1月8日作成者: jarxiv

要約デジタル画像操作の進化、特にディープ生成モデルの進歩は、特にディープフェイ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Click2Mask: Local Editing with Dynamic Mask Generation

MADation: Face Morphing Attack Detection with Foundation Models

Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

Cosmos World Foundation Model Platform for Physical AI

VTAO-BiManip: Masked Visual-Tactile-Action Pre-training with Object Understanding for Bimanual Dexterous Manipulation

MULTI: Multimodal Understanding Leaderboard with Text and Images

Materialist: Physically Based Editing Using Single-Image Inverse Rendering

Self-adaptive vision-language model for 3D segmentation of pulmonary artery and vein

Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction

Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection

最近の投稿

最近のコメント

アーカイブ

カテゴリー