月別アーカイブ: 2024年4月

Real-world Instance-specific Image Goal Navigation for Service Robots: Bridging the Domain Gap with Contrastive Learning

要約 クエリ画像から実世界環境内の同一オブジェクトの位置を特定するインスタンス固 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | Real-world Instance-specific Image Goal Navigation for Service Robots: Bridging the Domain Gap with Contrastive Learning はコメントを受け付けていません

SyncDreamer: Generating Multiview-consistent Images from a Single-view Image

要約 本稿では、単視点画像から多視点の一貫性のある画像を生成する、と呼ばれる新し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | SyncDreamer: Generating Multiview-consistent Images from a Single-view Image はコメントを受け付けていません

Do LLMs Understand Visual Anomalies? Uncovering LLM Capabilities in Zero-shot Anomaly Detection

要約 大規模ビジョン言語モデル (LVLM) は、自然言語に基づいて視覚表現を導 … 続きを読む

カテゴリー: cs.CV, cs.MM | Do LLMs Understand Visual Anomalies? Uncovering LLM Capabilities in Zero-shot Anomaly Detection はコメントを受け付けていません

A Survey of Neural Network Robustness Assessment in Image Recognition

要約 近年、ニューラルネットワークの堅牢性評価に大きな注目が集まっています。 堅 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SY, eess.SY | A Survey of Neural Network Robustness Assessment in Image Recognition はコメントを受け付けていません

Deformable MRI Sequence Registration for AI-based Prostate Cancer Diagnosis

要約 PI-CAI (Prostate Imaging: Cancer AI) … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.QM | Deformable MRI Sequence Registration for AI-based Prostate Cancer Diagnosis はコメントを受け付けていません

Dancing with Still Images: Video Distillation via Static-Dynamic Disentanglement

要約 最近、データセットの蒸留により、特に画像データセットの効率的な機械学習への … 続きを読む

カテゴリー: cs.CV, cs.LG | Dancing with Still Images: Video Distillation via Static-Dynamic Disentanglement はコメントを受け付けていません

Towards Variable and Coordinated Holistic Co-Speech Motion Generation

要約 この論文では、可変性と調整という 2 つの重要な側面に焦点を当てて、3D … 続きを読む

カテゴリー: cs.CV | Towards Variable and Coordinated Holistic Co-Speech Motion Generation はコメントを受け付けていません

Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition

要約 私たちは、テンソル分解によるネットワーク圧縮の有効性を研究することで、高度 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition はコメントを受け付けていません

Physics-guided Shape-from-Template: Monocular Video Perception through Neural Surrogate Models

要約 動的シーンの 3D 再構成はコンピュータ グラフィックスにおける長年の問題 … 続きを読む

カテゴリー: cs.CV, cs.LG | Physics-guided Shape-from-Template: Monocular Video Perception through Neural Surrogate Models はコメントを受け付けていません

Harnessing GPT-4V(ision) for Insurance: A Preliminary Exploration

要約 大規模マルチモーダル モデル (LMM) の出現は、人工知能の開発における … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Harnessing GPT-4V(ision) for Insurance: A Preliminary Exploration はコメントを受け付けていません