月別アーカイブ: 2024年6月

Blind Image Deblurring using FFT-ReLU with Deep Learning Pipeline Integration

要約 ブラインド画像のブラー除去は、ぼやけた画像から鮮明な画像とブラー カーネル … 続きを読む

カテゴリー: cs.CV | Blind Image Deblurring using FFT-ReLU with Deep Learning Pipeline Integration はコメントを受け付けていません

DocSynthv2: A Practical Autoregressive Modeling for Document Generation

要約 ドキュメント レイアウトの生成は広く研究されていますが、レイアウトとコンテ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | DocSynthv2: A Practical Autoregressive Modeling for Document Generation はコメントを受け付けていません

From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition

要約 人々の社会的関係は、結婚指輪、バラ、ハグ、手をつなぐなど、特定の物体や相互 … 続きを読む

カテゴリー: cs.AI, cs.CV | From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition はコメントを受け付けていません

APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentatio

要約 フューショット セマンティック セグメンテーション (FSS) は、少数の … 続きを読む

カテゴリー: cs.CV | APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentatio はコメントを受け付けていません

2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction

要約 陽電子放出断層撮影法 (PET) は重要な臨床画像ツールですが、患者や医療 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | 2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction はコメントを受け付けていません

DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor

要約 事前トレーニングされたネットワークによって抽出された画像の詳細な特徴には、 … 続きを読む

カテゴリー: cs.CV | DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor はコメントを受け付けていません

Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze

要約 この論文では、スマートグラスにおけるユーザー支援を進化させるための重要なコ … 続きを読む

カテゴリー: cs.CV | Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze はコメントを受け付けていません

LaneCPP: Continuous 3D Lane Detection using Physical Priors

要約 単眼 3D 車線検出は、路面の検出と車線区分線の位置の特定というタスクで構 … 続きを読む

カテゴリー: cs.CV | LaneCPP: Continuous 3D Lane Detection using Physical Priors はコメントを受け付けていません

Descriptive Image Quality Assessment in the Wild

要約 ビジョン言語モデル (VLM) の急速な進歩に伴い、VLM ベースの画質評 … 続きを読む

カテゴリー: cs.CV | Descriptive Image Quality Assessment in the Wild はコメントを受け付けていません

FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation

要約 最近、伝統的にプロのデザイナーの領域である芸術的なフォントを作成するための … 続きを読む

カテゴリー: cs.CV | FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation はコメントを受け付けていません