月別アーカイブ: 2024年4月

SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints

要約 復路中に反対の視点から場所を認識することは、人間のドライバーにとって一般的 … 続きを読む

カテゴリー: cs.CV, cs.RO | SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints はコメントを受け付けていません

Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold

要約 この論文では、ニューラル ネットワーク モデルの特徴依存性を測定する新しい … 続きを読む

カテゴリー: cs.CV, cs.LG | Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold はコメントを受け付けていません

AniClipart: Clipart Animation with Text-to-Video Priors

要約 既製のグラフィック アート形式である Clipart は、視覚的なコンテン … 続きを読む

カテゴリー: cs.CV, cs.GR | AniClipart: Clipart Animation with Text-to-Video Priors はコメントを受け付けていません

Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery

要約 Generalized Class Discovery (GCD) は、ラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery はコメントを受け付けていません

Point-In-Context: Understanding Point Cloud via In-Context Learning

要約 多様なデータセットでトレーニングされた大規模モデルの出現により、特に自然言 … 続きを読む

カテゴリー: cs.CV | Point-In-Context: Understanding Point Cloud via In-Context Learning はコメントを受け付けていません

V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning

要約 ビデオの要約は、長いビデオの短く、正確で、まとまりのある要約を作成すること … 続きを読む

カテゴリー: cs.AI, cs.CV | V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning はコメントを受け付けていません

Inverse Neural Rendering for Explainable Multi-Object Tracking

要約 現在、画像理解タスクのほとんどの方法はフィードフォワード ニューラル ネッ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.RO | Inverse Neural Rendering for Explainable Multi-Object Tracking はコメントを受け付けていません

Gradient-Regularized Out-of-Distribution Detection

要約 実際のアプリケーションにおけるニューラル ネットワークの課題の 1 つは、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Gradient-Regularized Out-of-Distribution Detection はコメントを受け付けていません

MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale

要約 画像ベースの医療質問に対して言語で応答する Medical Visual … 続きを読む

カテゴリー: cs.CV | MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale はコメントを受け付けていません

Dynamic Gaussians Mesh: Consistent Mesh Reconstruction from Monocular Videos

要約 最新の 3D エンジンとグラフィックス パイプラインには、メモリ効率の高い … 続きを読む

カテゴリー: cs.CV | Dynamic Gaussians Mesh: Consistent Mesh Reconstruction from Monocular Videos はコメントを受け付けていません