月別アーカイブ: 2024年8月

Point-supervised Brain Tumor Segmentation with Box-prompted MedSAM

要約 病変や解剖学的構造を描出することは、画像誘導による治療において重要である。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, physics.med-ph | Point-supervised Brain Tumor Segmentation with Box-prompted MedSAM はコメントを受け付けていません

Synthetic dual image generation for reduction of labeling efforts in semantic segmentation of micrographs with a customized metric function

要約 材料分析のためのセマンティック・セグメンテーション・モデルのトレーニングに … 続きを読む

カテゴリー: cs.CE, cs.CV, cs.LG | Synthetic dual image generation for reduction of labeling efforts in semantic segmentation of micrographs with a customized metric function はコメントを受け付けていません

MotionFix: Text-Driven 3D Human Motion Editing

要約 本論文の焦点は3Dモーション編集である。人間の3Dモーションと、希望する修 … 続きを読む

カテゴリー: cs.CV, cs.GR | MotionFix: Text-Driven 3D Human Motion Editing はコメントを受け付けていません

SAM 2: Segment Anything in Images and Videos

要約 本論文では、画像や動画におけるプロンプト可能な視覚的セグメンテーションを解 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SAM 2: Segment Anything in Images and Videos はコメントを受け付けていません

TurboEdit: Text-Based Image Editing Using Few-Step Diffusion Models

要約 拡散モデルは、幅広いテキストベースの画像編集フレームワークへの道を開いた。 … 続きを読む

カテゴリー: cs.CV, cs.GR | TurboEdit: Text-Based Image Editing Using Few-Step Diffusion Models はコメントを受け付けていません

Virchow 2: Scaling Self-Supervised Mixed Magnification Models in Pathology

要約 計算病理学アプリケーションのための基礎モデルが急速に開発されている。しかし … 続きを読む

カテゴリー: cs.CV | Virchow 2: Scaling Self-Supervised Mixed Magnification Models in Pathology はコメントを受け付けていません

Collaborative Vision-Text Representation Optimizing for Open-Vocabulary Segmentation

要約 CLIPのような事前学習された視覚言語モデルは、視覚とテキストの埋め込み空 … 続きを読む

カテゴリー: cs.CV | Collaborative Vision-Text Representation Optimizing for Open-Vocabulary Segmentation はコメントを受け付けていません

Leaf Angle Estimation using Mask R-CNN and LETR Vision Transformer

要約 現代の研究では、高収量作物品種と直立葉角の植物との間に高い相関関係があるこ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Leaf Angle Estimation using Mask R-CNN and LETR Vision Transformer はコメントを受け付けていません

Coarse Correspondence Elicit 3D Spacetime Understanding in Multimodal Language Model

要約 マルチモーダル言語モデル(MLLM)は、3次元空間を解釈し、時間的ダイナミ … 続きを読む

カテゴリー: cs.CV, cs.LG | Coarse Correspondence Elicit 3D Spacetime Understanding in Multimodal Language Model はコメントを受け付けていません

Segment anything model 2: an application to 2D and 3D medical images

要約 SAM(Segment Anything Model:セグメント何でもモデ … 続きを読む

カテゴリー: cs.AI, cs.CV | Segment anything model 2: an application to 2D and 3D medical images はコメントを受け付けていません