月別アーカイブ: 2024年4月

Zero-Shot Segmentation of Eye Features Using the Segment Anything Model (SAM)

要約 基礎モデルの出現は、人工知能の新時代の到来を告げています。 Segment … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Zero-Shot Segmentation of Eye Features Using the Segment Anything Model (SAM) はコメントを受け付けていません

Taming Transformers for Realistic Lidar Point Cloud Generation

要約 拡散モデル (DM) は、サンプリング中の安定したトレーニングと反復改良の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Taming Transformers for Realistic Lidar Point Cloud Generation はコメントを受け付けていません

Impact of LiDAR visualisations on semantic segmentation of archaeological objects

要約 LiDAR ベースの考古学研究における深層学習手法では、デジタル標高モデル … 続きを読む

カテゴリー: cs.CV | Impact of LiDAR visualisations on semantic segmentation of archaeological objects はコメントを受け付けていません

DepthMOT: Depth Cues Lead to a Strong Multi-Object Tracker

要約 各オブジェクトを正確に区別することは、マルチオブジェクト追跡 (MOT) … 続きを読む

カテゴリー: cs.CV | DepthMOT: Depth Cues Lead to a Strong Multi-Object Tracker はコメントを受け付けていません

Investigating the Effectiveness of Cross-Attention to Unlock Zero-Shot Editing of Text-to-Video Diffusion Models

要約 コンテンツ作成のための画像およびビデオの拡散モデルの最近の進歩に伴い、生成 … 続きを読む

カテゴリー: cs.CV, cs.LG | Investigating the Effectiveness of Cross-Attention to Unlock Zero-Shot Editing of Text-to-Video Diffusion Models はコメントを受け付けていません

RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation

要約 リアルタイムの複数人の姿勢推定には、速度と精度のバランスをとる上で大きな課 … 続きを読む

カテゴリー: cs.CV | RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation はコメントを受け付けていません

SiT-MLP: A Simple MLP with Point-wise Topology Feature Learning for Skeleton-based Action Recognition

要約 グラフ畳み込みネットワーク (GCN) は、スケルトンベースのアクション認 … 続きを読む

カテゴリー: cs.CV | SiT-MLP: A Simple MLP with Point-wise Topology Feature Learning for Skeleton-based Action Recognition はコメントを受け付けていません

SepVAE: a contrastive VAE to separate pathological patterns from healthy ones

要約 対照分析 VAE (CA-VAE) は、バックグラウンド データセット ( … 続きを読む

カテゴリー: cs.CV, stat.ML | SepVAE: a contrastive VAE to separate pathological patterns from healthy ones はコメントを受け付けていません

TIM: A Time Interval Machine for Audio-Visual Action Recognition

要約 多様なアクションにより、長いビデオの中で豊かなオーディオビジュアル信号が生 … 続きを読む

カテゴリー: cs.CV | TIM: A Time Interval Machine for Audio-Visual Action Recognition はコメントを受け付けていません

DPHMs: Diffusion Parametric Head Models for Depth-based Tracking

要約 拡散パラメトリック頭部モデル (DPHM) を紹介します。これは、堅牢な体 … 続きを読む

カテゴリー: cs.CV | DPHMs: Diffusion Parametric Head Models for Depth-based Tracking はコメントを受け付けていません