月別アーカイブ: 2024年4月

SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints

投稿日: 2024年4月19日作成者: jarxiv

要約復路中に反対の視点から場所を認識することは、人間のドライバーにとって一般的 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold

投稿日: 2024年4月19日作成者: jarxiv

要約この論文では、ニューラルネットワークモデルの特徴依存性を測定する新しい … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

AniClipart: Clipart Animation with Text-to-Video Priors

投稿日: 2024年4月19日作成者: jarxiv

要約既製のグラフィックアート形式である Clipart は、視覚的なコンテン … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery

投稿日: 2024年4月19日作成者: jarxiv

要約 Generalized Class Discovery (GCD) は、ラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Point-In-Context: Understanding Point Cloud via In-Context Learning

投稿日: 2024年4月19日作成者: jarxiv

要約多様なデータセットでトレーニングされた大規模モデルの出現により、特に自然言 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning

投稿日: 2024年4月19日作成者: jarxiv

要約ビデオの要約は、長いビデオの短く、正確で、まとまりのある要約を作成すること … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Inverse Neural Rendering for Explainable Multi-Object Tracking

投稿日: 2024年4月19日作成者: jarxiv

要約現在、画像理解タスクのほとんどの方法はフィードフォワードニューラルネッ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.RO | コメントを受け付けていません

Gradient-Regularized Out-of-Distribution Detection

投稿日: 2024年4月19日作成者: jarxiv

要約実際のアプリケーションにおけるニューラルネットワークの課題の 1 つは、 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale

投稿日: 2024年4月19日作成者: jarxiv

要約画像ベースの医療質問に対して言語で応答する Medical Visual … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dynamic Gaussians Mesh: Consistent Mesh Reconstruction from Monocular Videos

投稿日: 2024年4月19日作成者: jarxiv

要約最新の 3D エンジンとグラフィックスパイプラインには、メモリ効率の高い … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年4月

SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints

Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold

AniClipart: Clipart Animation with Text-to-Video Priors

Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery

Point-In-Context: Understanding Point Cloud via In-Context Learning

V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning

Inverse Neural Rendering for Explainable Multi-Object Tracking

Gradient-Regularized Out-of-Distribution Detection

MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale

Dynamic Gaussians Mesh: Consistent Mesh Reconstruction from Monocular Videos

最近の投稿

最近のコメント

アーカイブ

カテゴリー