月別アーカイブ: 2024年7月

For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives

要約 ソーシャルネットワークは、人間の顔や体のイメージの認知的、感情的、実用的な … 続きを読む

カテゴリー: cs.CV | For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives はコメントを受け付けていません

A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars

要約 本論文の目的は、Spoken2Sign翻訳と呼ばれる、音声言語を手話言語に … 続きを読む

カテゴリー: cs.CV | A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars はコメントを受け付けていません

VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation

要約 複雑な人間の活動認識(CHAR)は、ユビキタスコンピューティング、特にスマ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, eess.SP | VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation はコメントを受け付けていません

Biomechanics-informed Non-rigid Medical Image Registration and its Inverse Material Property Estimation with Linear and Nonlinear Elasticity

要約 本論文では、物理情報ニューラルネットワーク(PINN)を用いて、生体力学的 … 続きを読む

カテゴリー: cs.CV | Biomechanics-informed Non-rigid Medical Image Registration and its Inverse Material Property Estimation with Linear and Nonlinear Elasticity はコメントを受け付けていません

DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception

要約 大規模言語モデル(LLM)の開発は、大規模マルチモーダルモデル(LMM)の … 続きを読む

カテゴリー: cs.CL, cs.CV | DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception はコメントを受け付けていません

Improved Noise Schedule for Diffusion Training

要約 拡散モデルは、視覚信号を生成するための事実上の選択肢として登場した。しかし … 続きを読む

カテゴリー: cs.AI, cs.CV | Improved Noise Schedule for Diffusion Training はコメントを受け付けていません

Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery

要約 ラベル付けされていないデータセットにおいて、継続的に新しい概念を発見するこ … 続きを読む

カテゴリー: cs.CV, cs.LG | Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery はコメントを受け付けていません

DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents

要約 拡散モデル(DM)は生成学習に革命をもたらした。DMは拡散過程を利用して、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents はコメントを受け付けていません

Smart City Surveillance Unveiling Indian Person Attributes in Real Time

要約 このプロジェクトは、リアルタイムで人の属性を識別・分析できるインドの都市向 … 続きを読む

カテゴリー: cs.CV | Smart City Surveillance Unveiling Indian Person Attributes in Real Time はコメントを受け付けていません

HoloHisto: End-to-end Gigapixel WSI Segmentation with 4K Resolution Sequential Tokenization

要約 デジタル病理学において、ディープラーニングに基づく画像セグメンテーションの … 続きを読む

カテゴリー: cs.CV, eess.IV | HoloHisto: End-to-end Gigapixel WSI Segmentation with 4K Resolution Sequential Tokenization はコメントを受け付けていません