cs.CV」カテゴリーアーカイブ

Target Prompting for Information Extraction with Vision Language Model

要約 Large Vision and Language モデルの最近の傾向は、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Target Prompting for Information Extraction with Vision Language Model はコメントを受け付けていません

Using a Distance Sensor to Detect Deviations in a Planar Surface

要約 私たちは、小型の光学飛行時間型センサーからの瞬間測定のみを使用して、平面に … 続きを読む

カテゴリー: cs.CV, cs.RO | Using a Distance Sensor to Detect Deviations in a Planar Surface はコメントを受け付けていません

Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression

要約 学習型画像圧縮 (LIC) 方式の最近の進歩により、従来の手作りのコーデッ … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT | Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression はコメントを受け付けていません

Visualize and Paint GAN Activations

要約 私たちは、これらのモデルの内部動作をより深く理解し、無条件にトレーニングさ … 続きを読む

カテゴリー: cs.CV, cs.LG | Visualize and Paint GAN Activations はコメントを受け付けていません

Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition

要約 外科的位相認識のための既存の最先端の方法は、短距離時間分解能での時空間特徴 … 続きを読む

カテゴリー: cs.CV | Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition はコメントを受け付けていません

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

要約 単眼の 3D 物体検出は自動運転において重要な役割を果たします。 ただし、 … 続きを読む

カテゴリー: cs.CV | Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training はコメントを受け付けていません

Global-Local Progressive Integration Network for Blind Image Quality Assessment

要約 ビジョン トランスフォーマー (ViT) は、長期的な依存関係をモデル化す … 続きを読む

カテゴリー: cs.CV, eess.IV | Global-Local Progressive Integration Network for Blind Image Quality Assessment はコメントを受け付けていません

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

要約 生徒と教師のネットワークに基づく知識の蒸留は、困難な教師なし異常検出タスク … 続きを読む

カテゴリー: cs.CV | Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection はコメントを受け付けていません

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

要約 生成モデルの急速な発展により、人工知能生成コンテンツ (AIGC) が日常 … 続きを読む

カテゴリー: cs.CV | Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment はコメントを受け付けていません

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

要約 車両軌道予測はデータ駆動型ソリューションへの依存度が高まっていますが、さま … 続きを読む

カテゴリー: cs.CV | UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction はコメントを受け付けていません