cs.CV」カテゴリーアーカイブ

Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints

要約 拡散トランス(DIT)は、画像とビデオ生成の強力なアーキテクチャとして浮上 … 続きを読む

カテゴリー: cs.CV | Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints はコメントを受け付けていません

Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization

要約 視覚言語モデル(VLM)の急速な進歩は、マルチモーダルの理解を変えましたが … 続きを読む

カテゴリー: cs.AI, cs.CV | Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization はコメントを受け付けていません

Next-Best-Trajectory Planning of Robot Manipulators for Effective Observation and Exploration

要約 オブジェクトの視覚的観測は、オブジェクトの再構築と操作、ナビゲーション、シ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.RO | Next-Best-Trajectory Planning of Robot Manipulators for Effective Observation and Exploration はコメントを受け付けていません

Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012

要約 このペーパーでは、デジタル形式で入手可能な米国大統領キャンペーンテレビ広告 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012 はコメントを受け付けていません

KEVS: Enhancing Segmentation of Visceral Adipose Tissue in Pre-Cystectomy CT with Gaussian Kernel Density Estimation

要約 目的:膀胱切除患者における内臓脂肪組織(VAT)の分布は、術後合併症の発生 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | KEVS: Enhancing Segmentation of Visceral Adipose Tissue in Pre-Cystectomy CT with Gaussian Kernel Density Estimation はコメントを受け付けていません

USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving

要約 この作業では、自律運転コンテキストでの3Dオブジェクト検出器の安全指向のパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving はコメントを受け付けていません

TULIP: Token-length Upgraded CLIP

要約 クリップなどのビジョン言語モデルで長いキャプションを表現するという課題に対 … 続きを読む

カテゴリー: cs.CV | TULIP: Token-length Upgraded CLIP はコメントを受け付けていません

Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis

要約 トーキングヘッド合成は、コンピューターグラフィックスとマルチメディアの重要 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis はコメントを受け付けていません

Exploring Saliency Bias in Manipulation Detection

要約 改ざんされた画像によってサポートされている偽のニュースと誤った情報のソーシ … 続きを読む

カテゴリー: cs.CV | Exploring Saliency Bias in Manipulation Detection はコメントを受け付けていません

A Progressive Risk Formulation for Enhanced Deep Learning based Total Knee Replacement Prediction in Knee Osteoarthritis

要約 膝の変形性関節症患者のさまざまな時間の範囲内で、膝の合計置換(TKR)のニ … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.QM | A Progressive Risk Formulation for Enhanced Deep Learning based Total Knee Replacement Prediction in Knee Osteoarthritis はコメントを受け付けていません