投稿者「jarxiv」のアーカイブ

DPMambaIR:All-in-One Image Restoration via Degradation-Aware Prompt State Space Model

要約 オールインワン画像の修復は、単一のモデルを使用して複数の画像劣化の問題に対 … 続きを読む

カテゴリー: cs.CV, I.4.4 | DPMambaIR:All-in-One Image Restoration via Degradation-Aware Prompt State Space Model はコメントを受け付けていません

EgoCHARM: Resource-Efficient Hierarchical Activity Recognition using an Egocentric IMU Sensor

要約 SmartGlassesの人間の活動認識(HAR)には、健康/フィットネス … 続きを読む

カテゴリー: cs.CV, cs.LG | EgoCHARM: Resource-Efficient Hierarchical Activity Recognition using an Egocentric IMU Sensor はコメントを受け付けていません

Step1X-Edit: A Practical Framework for General Image Editing

要約 近年、画像編集モデルは驚くべき急速な発展を目撃しています。 GPT-4Oや … 続きを読む

カテゴリー: cs.CV | Step1X-Edit: A Practical Framework for General Image Editing はコメントを受け付けていません

ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images

要約 医療画像技術の進歩により、疾患の進行を監視するために、同じ患者の繰り返しス … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images はコメントを受け付けていません

DiffKillR: Killing and Recreating Diffeomorphisms for Cell Annotation in Dense Microscopy Images

要約 自動化された全体のスライドスキャンの進歩によって駆動されるデジタル顕微鏡画 … 続きを読む

カテゴリー: cs.CV | DiffKillR: Killing and Recreating Diffeomorphisms for Cell Annotation in Dense Microscopy Images はコメントを受け付けていません

HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding

要約 マルチモーダルの大手言語モデル(MLLM)の進歩にもかかわらず、現在のアプ … 続きを読む

カテゴリー: cs.CV | HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding はコメントを受け付けていません

The Fourth Monocular Depth Estimation Challenge

要約 このホワイトペーパーでは、第4版のMonocular Depth推定チャレ … 続きを読む

カテゴリー: cs.CV | The Fourth Monocular Depth Estimation Challenge はコメントを受け付けていません

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

要約 言語生成において長く支配的な自己回帰(AR)モデルは、画像合成にますます適 … 続きを読む

カテゴリー: cs.CV | Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models はコメントを受け付けていません

Dynamic Camera Poses and Where to Find Them

要約 カメラの注釈をアノテートすると、ダイナミックなインターネット動画でのポーズ … 続きを読む

カテゴリー: cs.CV | Dynamic Camera Poses and Where to Find Them はコメントを受け付けていません

LiDPM: Rethinking Point Diffusion for Lidar Scene Completion

要約 屋外シーンのスケールでライダーポイントで直接動作するトレーニング拡散モデル … 続きを読む

カテゴリー: cs.CV, cs.RO | LiDPM: Rethinking Point Diffusion for Lidar Scene Completion はコメントを受け付けていません