月別アーカイブ: 2024年6月

SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues

要約 弱い教師付き医療画像のセグメンテーションは、セグメンテーションのパフォーマ … 続きを読む

カテゴリー: cs.CV | SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues はコメントを受け付けていません

Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model

要約 トランスフォーマーベースのセグメンテーション手法は、高解像度の画像を扱う際 … 続きを読む

カテゴリー: cs.CV | Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model はコメントを受け付けていません

Taming Data and Transformers for Audio Generation

要約 環境音や環境効果の生成は、データ不足とキャプションの品質が不十分なことが多 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | Taming Data and Transformers for Audio Generation はコメントを受け付けていません

OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding

要約 現在のユニバーサル セグメンテーション手法は、ピクセル レベルの画像とビデ … 続きを読む

カテゴリー: cs.CV | OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding はコメントを受け付けていません

SALVe: Semantic Alignment Verification for Floorplan Reconstruction from Sparse Panoramas

要約 私たちは、新しいペアワイズ学習アライメント検証器である SALVe によっ … 続きを読む

カテゴリー: cs.CV | SALVe: Semantic Alignment Verification for Floorplan Reconstruction from Sparse Panoramas はコメントを受け付けていません

Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads

要約 視覚認識タスクは、主に Vision Transformer (ViT) … 続きを読む

カテゴリー: cs.CV | Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads はコメントを受け付けていません

ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos

要約 ビデオ イベント内で時間的推論を実行する AI モデルの能力を厳密にテスト … 続きを読む

カテゴリー: cs.CV | ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos はコメントを受け付けていません

Looking 3D: Anomaly Detection with 2D-3D Alignment

要約 視覚的な手がかりに基づく自動異常検出は、製造や製品品質評価などのさまざまな … 続きを読む

カテゴリー: cs.CV | Looking 3D: Anomaly Detection with 2D-3D Alignment はコメントを受け付けていません

HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection

要約 ほとんどの WSOD 手法は、候補領域を生成するために従来のオブジェクト提 … 続きを読む

カテゴリー: cs.CV | HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection はコメントを受け付けていません

Dataset Size Recovery from LoRA Weights

要約 モデル反転攻撃とメンバーシップ推論攻撃は、モデルがトレーニングされたデータ … 続きを読む

カテゴリー: cs.CV | Dataset Size Recovery from LoRA Weights はコメントを受け付けていません