「cs.CV」カテゴリーアーカイブ

Target Prompting for Information Extraction with Vision Language Model

投稿日: 2024年8月8日作成者: jarxiv

要約 Large Vision and Language モデルの最近の傾向は、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Using a Distance Sensor to Detect Deviations in a Planar Surface

投稿日: 2024年8月8日作成者: jarxiv

要約私たちは、小型の光学飛行時間型センサーからの瞬間測定のみを使用して、平面に … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression

投稿日: 2024年8月8日作成者: jarxiv

要約学習型画像圧縮 (LIC) 方式の最近の進歩により、従来の手作りのコーデッ … 続きを読む →

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT | コメントを受け付けていません

Visualize and Paint GAN Activations

投稿日: 2024年8月8日作成者: jarxiv

要約私たちは、これらのモデルの内部動作をより深く理解し、無条件にトレーニングさ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition

投稿日: 2024年8月8日作成者: jarxiv

要約外科的位相認識のための既存の最先端の方法は、短距離時間分解能での時空間特徴 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

投稿日: 2024年8月8日作成者: jarxiv

要約単眼の 3D 物体検出は自動運転において重要な役割を果たします。ただし、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Global-Local Progressive Integration Network for Blind Image Quality Assessment

投稿日: 2024年8月8日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、長期的な依存関係をモデル化す … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

投稿日: 2024年8月8日作成者: jarxiv

要約生徒と教師のネットワークに基づく知識の蒸留は、困難な教師なし異常検出タスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

投稿日: 2024年8月8日作成者: jarxiv

要約生成モデルの急速な発展により、人工知能生成コンテンツ (AIGC) が日常 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

投稿日: 2024年8月8日作成者: jarxiv

要約車両軌道予測はデータ駆動型ソリューションへの依存度が高まっていますが、さま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Target Prompting for Information Extraction with Vision Language Model

Using a Distance Sensor to Detect Deviations in a Planar Surface

Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression

Visualize and Paint GAN Activations

Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition

Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training

Global-Local Progressive Integration Network for Blind Image Quality Assessment

Dual-Modeling Decouple Distillation for Unsupervised Anomaly Detection

Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

最近の投稿

最近のコメント

アーカイブ

カテゴリー