月別アーカイブ: 2024年7月

Multi-Attribute Vision Transformers are Efficient and Robust Learners

要約 ビジョン トランスフォーマー (ViT) は、その誕生以来、幅広いタスクに … 続きを読む

カテゴリー: cs.CV | Multi-Attribute Vision Transformers are Efficient and Robust Learners はコメントを受け付けていません

AttentNet: Fully Convolutional 3D Attention for Lung Nodule Detection

要約 アテンション メカニズムの人気の高まりを背景に、スクイーズ アンド エキサ … 続きを読む

カテゴリー: cs.CV | AttentNet: Fully Convolutional 3D Attention for Lung Nodule Detection はコメントを受け付けていません

MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images

要約 マルチスペクトル画像から太陽活動領域 (AR) の位置を正確に特定すること … 続きを読む

カテゴリー: cs.CV, physics.space-ph | MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images はコメントを受け付けていません

Contrastive Learning with Counterfactual Explanations for Radiology Report Generation

要約 解剖学の内容が共通しているため、放射線画像と対応するレポートは高い類似性を … 続きを読む

カテゴリー: cs.CV | Contrastive Learning with Counterfactual Explanations for Radiology Report Generation はコメントを受け付けていません

A review on vision-based motion estimation

要約 接触センサーベースの運動測定と比較して、視覚ベースの運動測定は低コストと高 … 続きを読む

カテゴリー: cs.CV | A review on vision-based motion estimation はコメントを受け付けていません

EdgeSAM: Prompt-In-the-Loop Distillation for On-Device Deployment of SAM

要約 このペーパーでは、パフォーマンスの低下を最小限に抑えながらエッジ デバイス … 続きを読む

カテゴリー: cs.CV | EdgeSAM: Prompt-In-the-Loop Distillation for On-Device Deployment of SAM はコメントを受け付けていません

PD-TPE: Parallel Decoder with Text-guided Position Encoding for 3D Visual Grounding

要約 3D ビジュアル グラウンディングは、3D 点群シーンにおける自由形式の自 … 続きを読む

カテゴリー: cs.CV | PD-TPE: Parallel Decoder with Text-guided Position Encoding for 3D Visual Grounding はコメントを受け付けていません

Enhancing Layout Hotspot Detection Efficiency with YOLOv8 and PCA-Guided Augmentation

要約 このペーパーでは、デザイン ルール チェック (DRC) プロセスの効率と … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhancing Layout Hotspot Detection Efficiency with YOLOv8 and PCA-Guided Augmentation はコメントを受け付けていません

Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery

要約 コンセプト ボトルネック モデル (CBM) は、まず画像を人間が理解でき … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery はコメントを受け付けていません

M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models

要約 離散拡散モデルの長所を利用して、複数の動作のテキスト記述から人間の動作を生 … 続きを読む

カテゴリー: cs.CV | M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models はコメントを受け付けていません