月別アーカイブ: 2024年8月

TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation

投稿日: 2024年8月12日作成者: jarxiv

要約確率的ノイズ除去拡散モデル (DDM) は、2D 画像生成の新しい標準を設 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images

投稿日: 2024年8月12日作成者: jarxiv

要約視神経乳頭とカップのセグメンテーションは、緑内障、心筋梗塞、糖尿病性網膜症 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography

投稿日: 2024年8月12日作成者: jarxiv

要約トラクトグラフィーの暗黙の課題の 1 つは、特定のデータセットまたはバンド … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Learning to Generate Parameters of ConvNets for Unseen Image Data

投稿日: 2024年8月12日作成者: jarxiv

要約一般的な畳み込みニューラルネットワーク (ConvNet) は、大量の画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Object-level Geometric Structure Preserving for Natural Image Stitching

投稿日: 2024年8月12日作成者: jarxiv

要約世界的に自然な構造で画像をつなぎ合わせるというテーマは、位置合わせと歪みの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DeepInteraction++: Multi-Modality Interaction for Autonomous Driving

投稿日: 2024年8月12日作成者: jarxiv

要約既存の最高性能の自動運転システムは通常、信頼性の高いシーンの理解のためにマ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model

投稿日: 2024年8月12日作成者: jarxiv

要約最近、SDS 手法の登場により、テキストを 3D に変換するタスクが急速に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UNIC: Universal Classification Models via Multi-teacher Distillation

投稿日: 2024年8月12日作成者: jarxiv

要約事前トレーニングされたモデルはコモディティとなり、幅広いタスクで強力な結果 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models

投稿日: 2024年8月12日作成者: jarxiv

要約ビジョン言語モデル (VLM) の出現により、研究者は自然言語を使用してニ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation

投稿日: 2024年8月12日作成者: jarxiv

要約視覚と言語ナビゲーション (VLN) は、エージェントが指示を理解し、視覚 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

月別アーカイブ: 2024年8月

TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation

Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images

Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography

Learning to Generate Parameters of ConvNets for Unseen Image Data

Object-level Geometric Structure Preserving for Natural Image Stitching

DeepInteraction++: Multi-Modality Interaction for Autonomous Driving

DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model

UNIC: Universal Classification Models via Multi-teacher Distillation

IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models

Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation

最近の投稿

最近のコメント

アーカイブ

カテゴリー