月別アーカイブ: 2025年3月

RELD: Regularization by Latent Diffusion Models for Image Restoration

要約 近年、拡散モデルは深い生成モデリングにおける新しい最先端のモデルになり、生 … 続きを読む

カテゴリー: cs.CV, eess.IV | RELD: Regularization by Latent Diffusion Models for Image Restoration はコメントを受け付けていません

Advancing the Biological Plausibility and Efficacy of Hebbian Convolutional Neural Networks

要約 このペーパーで提示された研究は、イメージ処理のためのヘビアン学習の畳み込み … 続きを読む

カテゴリー: cs.CV, cs.NE, I.2.6 | Advancing the Biological Plausibility and Efficacy of Hebbian Convolutional Neural Networks はコメントを受け付けていません

Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints

要約 拡散トランス(DIT)は、画像とビデオ生成の強力なアーキテクチャとして浮上 … 続きを読む

カテゴリー: cs.CV | Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints はコメントを受け付けていません

Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization

要約 視覚言語モデル(VLM)の急速な進歩は、マルチモーダルの理解を変えましたが … 続きを読む

カテゴリー: cs.AI, cs.CV | Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization はコメントを受け付けていません

Next-Best-Trajectory Planning of Robot Manipulators for Effective Observation and Exploration

要約 オブジェクトの視覚的観測は、オブジェクトの再構築と操作、ナビゲーション、シ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.RO | Next-Best-Trajectory Planning of Robot Manipulators for Effective Observation and Exploration はコメントを受け付けていません

Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012

要約 このペーパーでは、デジタル形式で入手可能な米国大統領キャンペーンテレビ広告 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012 はコメントを受け付けていません

KEVS: Enhancing Segmentation of Visceral Adipose Tissue in Pre-Cystectomy CT with Gaussian Kernel Density Estimation

要約 目的:膀胱切除患者における内臓脂肪組織(VAT)の分布は、術後合併症の発生 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | KEVS: Enhancing Segmentation of Visceral Adipose Tissue in Pre-Cystectomy CT with Gaussian Kernel Density Estimation はコメントを受け付けていません

USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving

要約 この作業では、自律運転コンテキストでの3Dオブジェクト検出器の安全指向のパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving はコメントを受け付けていません

TULIP: Token-length Upgraded CLIP

要約 クリップなどのビジョン言語モデルで長いキャプションを表現するという課題に対 … 続きを読む

カテゴリー: cs.CV | TULIP: Token-length Upgraded CLIP はコメントを受け付けていません

Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis

要約 トーキングヘッド合成は、コンピューターグラフィックスとマルチメディアの重要 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis はコメントを受け付けていません