月別アーカイブ: 2024年9月

Gaussian is All You Need: A Unified Framework for Solving Inverse Problems via Diffusion Posterior Sampling

要約 拡散モデルは、複雑なデータ分布をモデル化することで、さまざまな高品質の画像 … 続きを読む

カテゴリー: cs.CV, eess.IV | Gaussian is All You Need: A Unified Framework for Solving Inverse Problems via Diffusion Posterior Sampling はコメントを受け付けていません

Does a Neural Network Really Encode Symbolic Concepts?

要約 最近、一連の研究が、DNN によってモデル化された入力変数間の相互作用を抽 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Does a Neural Network Really Encode Symbolic Concepts? はコメントを受け付けていません

ClearDepth: Enhanced Stereo Perception of Transparent Objects for Robotic Manipulation

要約 透明な物体の奥行き認識は、主に標準的な 3D センサーが透明または反射面の … 続きを読む

カテゴリー: cs.CV, cs.RO | ClearDepth: Enhanced Stereo Perception of Transparent Objects for Robotic Manipulation はコメントを受け付けていません

Pushing Joint Image Denoising and Classification to the Edge

要約 この論文では、画像分類と画像のノイズ除去を共同で組み合わせ、低照度のセキュ … 続きを読む

カテゴリー: cs.CV, eess.IV | Pushing Joint Image Denoising and Classification to the Edge はコメントを受け付けていません

A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis

要約 放射輝度フィールドの再照明は、単一の照明条件下でキャプチャされることが最も … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3 | A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis はコメントを受け付けていません

Pushing the boundaries of event subsampling in event-based video classification using CNNs

要約 イベント カメラは、エッジデバイス アプリケーションに最適な低電力視覚セン … 続きを読む

カテゴリー: cs.CV | Pushing the boundaries of event subsampling in event-based video classification using CNNs はコメントを受け付けていません

Pseudo-Prompt Generating in Pre-trained Vision-Language Models for Multi-Label Medical Image Classification

要約 医用画像認識のタスクは、さまざまで複数の病理学的兆候が存在するため特に複雑 … 続きを読む

カテゴリー: cs.CL, cs.CV | Pseudo-Prompt Generating in Pre-trained Vision-Language Models for Multi-Label Medical Image Classification はコメントを受け付けていません

NPGA: Neural Parametric Gaussian Avatars

要約 人間の頭の高忠実度のデジタル バージョンの作成は、仮想コンポーネントを私た … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | NPGA: Neural Parametric Gaussian Avatars はコメントを受け付けていません

An Efficient and Streaming Audio Visual Active Speaker Detection System

要約 このペーパーでは、アクティブ スピーカー検出 (ASD) という困難なタス … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | An Efficient and Streaming Audio Visual Active Speaker Detection System はコメントを受け付けていません

The Design of Informative Take-Over Requests for Semi-Autonomous Cyber-Physical Systems: Combining Spoken Language and Visual Icons in a Drone-Controller Setting

要約 サイバー物理システムが、制御を引き継いだり監視したりできる人間のパートナー … 続きを読む

カテゴリー: cs.CL, cs.HC, cs.RO | The Design of Informative Take-Over Requests for Semi-Autonomous Cyber-Physical Systems: Combining Spoken Language and Visual Icons in a Drone-Controller Setting はコメントを受け付けていません