月別アーカイブ: 2024年8月

TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation

要約 確率的ノイズ除去拡散モデル (DDM) は、2D 画像生成の新しい標準を設 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation はコメントを受け付けていません

Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images

要約 視神経乳頭とカップのセグメンテーションは、緑内障、心筋梗塞、糖尿病性網膜症 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images はコメントを受け付けていません

Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography

要約 トラクトグラフィーの暗黙の課題の 1 つは、特定のデータセットまたはバンド … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography はコメントを受け付けていません

Learning to Generate Parameters of ConvNets for Unseen Image Data

要約 一般的な畳み込みニューラル ネットワーク (ConvNet) は、大量の画 … 続きを読む

カテゴリー: cs.CV | Learning to Generate Parameters of ConvNets for Unseen Image Data はコメントを受け付けていません

Object-level Geometric Structure Preserving for Natural Image Stitching

要約 世界的に自然な構造で画像をつなぎ合わせるというテーマは、位置合わせと歪みの … 続きを読む

カテゴリー: cs.CV | Object-level Geometric Structure Preserving for Natural Image Stitching はコメントを受け付けていません

DeepInteraction++: Multi-Modality Interaction for Autonomous Driving

要約 既存の最高性能の自動運転システムは通常、信頼性の高いシーンの理解のためにマ … 続きを読む

カテゴリー: cs.CV | DeepInteraction++: Multi-Modality Interaction for Autonomous Driving はコメントを受け付けていません

DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model

要約 最近、SDS 手法の登場により、テキストを 3D に変換するタスクが急速に … 続きを読む

カテゴリー: cs.CV | DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model はコメントを受け付けていません

UNIC: Universal Classification Models via Multi-teacher Distillation

要約 事前トレーニングされたモデルはコモディティとなり、幅広いタスクで強力な結果 … 続きを読む

カテゴリー: cs.CV | UNIC: Universal Classification Models via Multi-teacher Distillation はコメントを受け付けていません

IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models

要約 ビジョン言語モデル (VLM) の出現により、研究者は自然言語を使用してニ … 続きを読む

カテゴリー: cs.CL, cs.CV | IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models はコメントを受け付けていません

Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation

要約 視覚と言語ナビゲーション (VLN) は、エージェントが指示を理解し、視覚 … 続きを読む

カテゴリー: cs.CV, cs.MM | Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation はコメントを受け付けていません