月別アーカイブ: 2024年2月

NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection

要約 NeRF-Det は、NeRF を革新的に利用して表現学習を強化することに … 続きを読む

カテゴリー: cs.CV | NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection はコメントを受け付けていません

AQD: Towards Accurate Fully-Quantized Object Detection

要約 ネットワーク量子化により、低精度の演算を使用して推論を実行できるようになり … 続きを読む

カテゴリー: cs.CV | AQD: Towards Accurate Fully-Quantized Object Detection はコメントを受け付けていません

Reimagining Anomalies: What If Anomalies Were Normal?

要約 深層学習ベースの手法は、画像の異常検出において画期的な進歩を遂げましたが、 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Reimagining Anomalies: What If Anomalies Were Normal? はコメントを受け付けていません

Single-Model Attribution of Generative Models Through Final-Layer Inversion

要約 生成モデリングにおける最近の進歩により、実用的な単一モデルのアトリビューシ … 続きを読む

カテゴリー: cs.CV, cs.LG | Single-Model Attribution of Generative Models Through Final-Layer Inversion はコメントを受け付けていません

A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams

要約 パーシステンス ダイアグラム (PD) はトポロジカル データ分析で中心的 … 続きを読む

カテゴリー: 55N31, 62R07, 62R40, 68T09, 68T10, cs.CG, cs.CV, cs.LG, I.2, math.AT | A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams はコメントを受け付けていません

Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition

要約 最近の研究では、大規模データを使用した一般的な視覚学習タスクで事前トレーニ … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition はコメントを受け付けていません

Deep vessel segmentation based on a new combination of vesselness filters

要約 血管セグメンテーションは重要な臨床タスクですが、その自動化は依然として課題 … 続きを読む

カテゴリー: cs.CV, eess.IV | Deep vessel segmentation based on a new combination of vesselness filters はコメントを受け付けていません

YOLO-World: Real-Time Open-Vocabulary Object Detection

要約 You Only Look Once (YOLO) シリーズの検出器は、効 … 続きを読む

カテゴリー: cs.CV | YOLO-World: Real-Time Open-Vocabulary Object Detection はコメントを受け付けていません

Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective

要約 大規模マルチモーダル モデル (LMM) は、視覚入力に存在しないコンテン … 続きを読む

カテゴリー: cs.CL, cs.CV | Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective はコメントを受け付けていません

FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing

要約 テキストからビデオへの編集は、テキストのプロンプトを条件としてソースビデオ … 続きを読む

カテゴリー: cs.CV | FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing はコメントを受け付けていません