月別アーカイブ: 2025年2月

GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs

要約 マルチモーダル大手言語モデル(MLLMS)の急速な開発により、テキストや画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs はコメントを受け付けていません

pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM

要約 Pyslamは、視覚的なスラムのオープンソースPythonフレームワークで … 続きを読む

カテゴリー: cs.CV, cs.RO | pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM はコメントを受け付けていません

Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023

要約 SCICAPデータセットが2021年に開始されて以来、研究コミュニティは学 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023 はコメントを受け付けていません

Learning Generalizable Prompt for CLIP with Class Similarity Knowledge

要約 Vision-Language Models(VLMS)では、迅速なチュー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learning Generalizable Prompt for CLIP with Class Similarity Knowledge はコメントを受け付けていません

Robust 6DoF Pose Tracking Considering Contour and Interior Correspondence Uncertainty for AR Assembly Guidance

要約 拡張現実アセンブリガイダンスは、インテリジェントな製造および医療用途に不可 … 続きを読む

カテゴリー: cs.CV | Robust 6DoF Pose Tracking Considering Contour and Interior Correspondence Uncertainty for AR Assembly Guidance はコメントを受け付けていません

Image Inversion: A Survey from GANs to Diffusion and Beyond

要約 画像の反転は、生成モデルの基本的なタスクであり、編集、復元、スタイルの転送 … 続きを読む

カテゴリー: cs.CV | Image Inversion: A Survey from GANs to Diffusion and Beyond はコメントを受け付けていません

Characterizing Photorealism and Artifacts in Diffusion Model-Generated Images

要約 拡散モデルで生成された画像は、本物の写真と区別できないように見える場合があ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Characterizing Photorealism and Artifacts in Diffusion Model-Generated Images はコメントを受け付けていません

On the Logic Elements Associated with Round-Off Errors and Gaussian Blur in Image Registration: A Simple Case of Commingling

要約 個別の画像登録は、ぼやけとノイズによって破損したサンプルから信号を再構築す … 続きを読む

カテゴリー: cs.CV | On the Logic Elements Associated with Round-Off Errors and Gaussian Blur in Image Registration: A Simple Case of Commingling はコメントを受け付けていません

MultiFlow: A unified deep learning framework for multi-vessel classification, segmentation and clustering of phase-contrast MRI validated on a multi-site single ventricle patient cohort

要約 この研究では、ヴェロシティエンコード位相コントラスト磁気共鳴画像データの分 … 続きを読む

カテゴリー: cs.CV | MultiFlow: A unified deep learning framework for multi-vessel classification, segmentation and clustering of phase-contrast MRI validated on a multi-site single ventricle patient cohort はコメントを受け付けていません

ConsistentDreamer: View-Consistent Meshes Through Balanced Multi-View Gaussian Optimization

要約 拡散モデルの最近の進歩により、3D生成が大幅に改善され、具体化されたAIシ … 続きを読む

カテゴリー: cs.CV | ConsistentDreamer: View-Consistent Meshes Through Balanced Multi-View Gaussian Optimization はコメントを受け付けていません