cs.CV」カテゴリーアーカイブ

OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference

要約 オープンソースのマルチモーダル大手言語モデル(MLLM)の最近の進歩は、主 … 続きを読む

カテゴリー: cs.CV | OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference はコメントを受け付けていません

Extreme Rotation Estimation in the Wild

要約 極端な設定でキャプチャされたインターネット画像のペア間の相対的な3D方向を … 続きを読む

カテゴリー: cs.CV | Extreme Rotation Estimation in the Wild はコメントを受け付けていません

MedKAN: An Advanced Kolmogorov-Arnold Network for Medical Image Classification

要約 画像分類のための深い学習の最近の進歩は、主に畳み込みニューラルネットワーク … 続きを読む

カテゴリー: cs.CV | MedKAN: An Advanced Kolmogorov-Arnold Network for Medical Image Classification はコメントを受け付けていません

GHOST 2.0: generative high-fidelity one shot transfer of heads

要約 フェイススワッピングのタスクは最近、研究コミュニティで注目を集めていますが … 続きを読む

カテゴリー: cs.CV | GHOST 2.0: generative high-fidelity one shot transfer of heads はコメントを受け付けていません

Imaging foundation model for universal enhancement of non-ideal measurement CT

要約 非理想的な測定コンピューター断層撮影(NICT)は、CTアプリケーションを … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Imaging foundation model for universal enhancement of non-ideal measurement CT はコメントを受け付けていません

K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs

要約 最近の研究では、さまざまなロラを組み合わせて、学習スタイルとコンテンツを共 … 続きを読む

カテゴリー: cs.CV | K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs はコメントを受け付けていません

Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving

要約 車両からすべての技術(V2X)は、知覚範囲を拡張し、閉塞を通して見るための … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, cs.RO, I.2.6 | Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving はコメントを受け付けていません

MegaLoc: One Retrieval to Place Them All

要約 特定のクエリと同じ場所から画像を取得することは、視覚的な場所認識、ランドマ … 続きを読む

カテゴリー: cs.CV | MegaLoc: One Retrieval to Place Them All はコメントを受け付けていません

Fractal Generative Models

要約 モジュール化は、コンピューターサイエンスの基礎であり、複雑な機能を原子ビル … 続きを読む

カテゴリー: cs.CV, cs.LG | Fractal Generative Models はコメントを受け付けていません

GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow

要約 占有率の推定は、3Dコンピュータービジョン、特に自律運転コミュニティ内で顕 … 続きを読む

カテゴリー: cs.CV | GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow はコメントを受け付けていません