cs.CV」カテゴリーアーカイブ

SR+Codec: a Benchmark of Super-Resolution for Video Compression Bitrate Reduction

要約 近年、低解像度の入力から高解像度の画像を生成する超解像(SR)に大きな関心 … 続きを読む

カテゴリー: cs.CV, eess.IV | SR+Codec: a Benchmark of Super-Resolution for Video Compression Bitrate Reduction はコメントを受け付けていません

A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks

要約 歩行認識は、特に他の生理学的バイオメトリクスが実用的でない、あるいは有効で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks はコメントを受け付けていません

Distillation of Diffusion Features for Semantic Correspondence

要約 画像の異なる部分間の関係を決定するタスクである意味的対応は、3D再構成、画 … 続きを読む

カテゴリー: cs.CV | Distillation of Diffusion Features for Semantic Correspondence はコメントを受け付けていません

KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training

要約 近年、CLIPは、マルチモーダルなシナリオにおいて画像とテキスト情報を整合 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training はコメントを受け付けていません

Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion

要約 拡散モデルは、その強い学習安定性と高い補完品質により、3D LiDARシー … 続きを読む

カテゴリー: cs.CV | Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion はコメントを受け付けていません

Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs

要約 我々は、視覚中心のアプローチで設計されたマルチモーダルLLM(MLLM)フ … 続きを読む

カテゴリー: cs.CV | Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs はコメントを受け付けていません

NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images

要約 近年の生成モデルの進歩により、マルチビューデータからの新規ビュー合成(NV … 続きを読む

カテゴリー: cs.CV | NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images はコメントを受け付けていません

Boosting Latent Diffusion with Flow Matching

要約 近年、視覚合成の性能は大きく飛躍しているが、これは主に生成モデルの飛躍的な … 続きを読む

カテゴリー: cs.CV | Boosting Latent Diffusion with Flow Matching はコメントを受け付けていません

Dense Scene Reconstruction from Light-Field Images Affected by Rolling Shutter

要約 本論文では、強いローリングシャッター(RS)効果を補正できる、ライトフィー … 続きを読む

カテゴリー: cs.CV | Dense Scene Reconstruction from Light-Field Images Affected by Rolling Shutter はコメントを受け付けていません

Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention

要約 自律走行トレーニングのためのマルチビュー映像の生成は最近注目を集めており、 … 続きを読む

カテゴリー: cs.CV | Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention はコメントを受け付けていません