月別アーカイブ: 2025年4月

MedSAM2: Segment Anything in 3D Medical Images and Videos

要約 医療画像や映像のセグメンテーションは、精密医療にとって重要なタスクであり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | MedSAM2: Segment Anything in 3D Medical Images and Videos はコメントを受け付けていません

Robust Human Registration with Body Part Segmentation on Noisy Point Clouds

要約 人間のメッシュを3D点群に登録することは、拡張現実や人間とロボットのインタ … 続きを読む

カテゴリー: cs.CV | Robust Human Registration with Body Part Segmentation on Noisy Point Clouds はコメントを受け付けていません

Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal

要約 ディープラーニングは、合成開口レーダー(SAR)画像と融合することで、光学 … 続きを読む

カテゴリー: cs.CV | Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal はコメントを受け付けていません

Autonomous and Self-Adapting System for Synthetic Media Detection and Attribution

要約 ジェネレーティブAIの急速な進歩により、非常にリアルな合成画像の作成が可能 … 続きを読む

カテゴリー: cs.AI, cs.CV | Autonomous and Self-Adapting System for Synthetic Media Detection and Attribution はコメントを受け付けていません

VISTA-OCR: Towards generative and interactive end to end OCR models

要約 を紹介します。(Vision and Spatially-aware Te … 続きを読む

カテゴリー: cs.CV | VISTA-OCR: Towards generative and interactive end to end OCR models はコメントを受け付けていません

Quantifying the uncertainty of model-based synthetic image quality metrics

要約 合成的に生成された画像(例えば拡散モデルによって生成された画像)の品質は、 … 続きを読む

カテゴリー: cs.CV | Quantifying the uncertainty of model-based synthetic image quality metrics はコメントを受け付けていません

An Algebraic Geometry Approach to Viewing Graph Solvability

要約 ビューインググラフの可解性という概念は、structure-from-mo … 続きを読む

カテゴリー: cs.CV, math.AG | An Algebraic Geometry Approach to Viewing Graph Solvability はコメントを受け付けていません

AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction

要約 大規模言語モデル(LLM)の進歩により、LLMを視覚モデルに組み込むことで … 続きを読む

カテゴリー: cs.AI, cs.CV | AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction はコメントを受け付けていません

Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions

要約 これは、均質化された標準的な体型を学習することが容易なため、既存のテキスト … 続きを読む

カテゴリー: cs.CV | Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions はコメントを受け付けていません

Bonsai: Interpretable Tree-Adaptive Grounded Reasoning

要約 汎用的な協調エージェントを開発するためには、(1)新しいドメインに適応でき … 続きを読む

カテゴリー: 68T37, 68T50, cs.AI, cs.CL, cs.CV, I.2.7 | Bonsai: Interpretable Tree-Adaptive Grounded Reasoning はコメントを受け付けていません