月別アーカイブ: 2025年2月

L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration

要約 ポイントクラウド登録は、コンピュータービジョンとロボット工学の多くのアプリ … 続きを読む

カテゴリー: cs.CV, cs.RO | L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration はコメントを受け付けていません

TruePose: Human-Parsing-guided Attention Diffusion for Full-ID Preserving Pose Transfer

要約 ポーズガイド付きの個人画像合成(PGPI)は、指定されたターゲットポーズ( … 続きを読む

カテゴリー: cs.AI, cs.CV | TruePose: Human-Parsing-guided Attention Diffusion for Full-ID Preserving Pose Transfer はコメントを受け付けていません

A Temporal Convolutional Network-Based Approach and a Benchmark Dataset for Colonoscopy Video Temporal Segmentation

要約 大腸内視鏡検査のコンピューター支援検出および診断システムの最近の進歩に続い … 続きを読む

カテゴリー: cs.CV, eess.IV | A Temporal Convolutional Network-Based Approach and a Benchmark Dataset for Colonoscopy Video Temporal Segmentation はコメントを受け付けていません

An Optimized Toolbox for Advanced Image Processing with Tsetlin Machine Composites

要約 Tsetlinマシン(TM)は、MNIST、K-MNIST、F-MNIST … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | An Optimized Toolbox for Advanced Image Processing with Tsetlin Machine Composites はコメントを受け付けていません

LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models

要約 視力を脅かす眼疾患の有病率は重大な世界的な負担であり、多くの場合、診断され … 続きを読む

カテゴリー: cs.CV | LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models はコメントを受け付けていません

Masked Autoencoders Are Effective Tokenizers for Diffusion Models

要約 潜在的な拡散モデルの最近の進歩により、高解像度の画像合成に対する有効性が実 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Masked Autoencoders Are Effective Tokenizers for Diffusion Models はコメントを受け付けていません

Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics

要約 大規模なモデルの最近の進歩により、画像から3Dの再構成が大幅に進歩していま … 続きを読む

カテゴリー: cs.CV | Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics はコメントを受け付けていません

SKI Models: Skeleton Induced Vision-Language Embeddings for Understanding Activities of Daily Living

要約 Clipのようなビジョン言語モデルの導入により、目に見えないビデオや人間の … 続きを読む

カテゴリー: cs.CV | SKI Models: Skeleton Induced Vision-Language Embeddings for Understanding Activities of Daily Living はコメントを受け付けていません

Seeing World Dynamics in a Nutshell

要約 私たちは、空間的に一時的に一貫した方法で、さりげなくキャプチャされたモノク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Seeing World Dynamics in a Nutshell はコメントを受け付けていません

OverThink: Slowdown Attacks on Reasoning LLMs

要約 LLMS-We Forceモデルの推論に依存しているアプリケーションのオー … 続きを読む

カテゴリー: cs.CR, cs.LG | OverThink: Slowdown Attacks on Reasoning LLMs はコメントを受け付けていません