月別アーカイブ: 2024年2月

NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection

投稿日: 2024年2月23日作成者: jarxiv

要約 NeRF-Det は、NeRF を革新的に利用して表現学習を強化することに … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AQD: Towards Accurate Fully-Quantized Object Detection

投稿日: 2024年2月23日作成者: jarxiv

要約ネットワーク量子化により、低精度の演算を使用して推論を実行できるようになり … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Reimagining Anomalies: What If Anomalies Were Normal?

投稿日: 2024年2月23日作成者: jarxiv

要約深層学習ベースの手法は、画像の異常検出において画期的な進歩を遂げましたが、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, stat.ML | コメントを受け付けていません

Single-Model Attribution of Generative Models Through Final-Layer Inversion

投稿日: 2024年2月23日作成者: jarxiv

要約生成モデリングにおける最近の進歩により、実用的な単一モデルのアトリビューシ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams

投稿日: 2024年2月23日作成者: jarxiv

要約パーシステンスダイアグラム (PD) はトポロジカルデータ分析で中心的 … 続きを読む →

カテゴリー: 55N31, 62R07, 62R40, 68T09, 68T10, cs.CG, cs.CV, cs.LG, I.2, math.AT | コメントを受け付けていません

Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition

投稿日: 2024年2月23日作成者: jarxiv

要約最近の研究では、大規模データを使用した一般的な視覚学習タスクで事前トレーニ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deep vessel segmentation based on a new combination of vesselness filters

投稿日: 2024年2月23日作成者: jarxiv

要約血管セグメンテーションは重要な臨床タスクですが、その自動化は依然として課題 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

YOLO-World: Real-Time Open-Vocabulary Object Detection

投稿日: 2024年2月23日作成者: jarxiv

要約 You Only Look Once (YOLO) シリーズの検出器は、効 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective

投稿日: 2024年2月23日作成者: jarxiv

要約大規模マルチモーダルモデル (LMM) は、視覚入力に存在しないコンテン … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing

投稿日: 2024年2月23日作成者: jarxiv

要約テキストからビデオへの編集は、テキストのプロンプトを条件としてソースビデオ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年2月

NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection

AQD: Towards Accurate Fully-Quantized Object Detection

Reimagining Anomalies: What If Anomalies Were Normal?

Single-Model Attribution of Generative Models Through Final-Layer Inversion

A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams

Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition

Deep vessel segmentation based on a new combination of vesselness filters

YOLO-World: Real-Time Open-Vocabulary Object Detection

Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective

FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing

最近の投稿

最近のコメント

アーカイブ

カテゴリー