投稿者「jarxiv」のアーカイブ

Explainable embeddings with Distance Explainer

投稿日: 2025年5月22日作成者: jarxiv

要約説明可能なAI（XAI）は大幅に進歩していますが、寸法が複雑な抽象化を表す … 続きを読む →

カテゴリー: 68T99, cs.AI, cs.CL, cs.CV, cs.LG, I.2.m | コメントを受け付けていません

Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network

投稿日: 2025年5月22日作成者: jarxiv

要約水中環境の制約を克服し、水中ターゲット検出モデルの精度と堅牢性を向上させる … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting

投稿日: 2025年5月22日作成者: jarxiv

要約近年、AIを使用して合成3Dオブジェクトを生成する能力が大幅に改善されてい … 続きを読む →

カテゴリー: cs.CV, cs.GR, I.2.10 | コメントを受け付けていません

Clapper: Compact Learning and Video Representation in VLMs

投稿日: 2025年5月22日作成者: jarxiv

要約現在のビジョン言語モデル（VLM）は、多様なビデオ理解アプリケーション全体 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment

投稿日: 2025年5月22日作成者: jarxiv

要約視聴覚学習の最近の進歩により、モダリティ全体の学習表現における有望な結果が … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field

投稿日: 2025年5月22日作成者: jarxiv

要約計算流体力学（CFD）は、流れ場を分析するための主なアプローチです。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation

投稿日: 2025年5月22日作成者: jarxiv

要約 3Dセマンティックセグメンテーションは、自律運転および道路インフラストラク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

M3TR: A Generalist Model for Real-World HD Map Completion

投稿日: 2025年5月22日作成者: jarxiv

要約自動運転車は操作のためにHDマップに依存していますが、オフラインのHDマッ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving

投稿日: 2025年5月22日作成者: jarxiv

要約自律運転で視覚的な質問回答（VQA）に採用されたビジョン言語モデル（VLM … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Scaling and Enhancing LLM-based AVSR: A Sparse Mixture of Projectors Approach

投稿日: 2025年5月22日作成者: jarxiv

要約視覚的なキューを統合することにより、騒々しい環境での視聴覚音声認識（AVS … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Explainable embeddings with Distance Explainer

Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network

PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting

Clapper: Compact Learning and Video Representation in VLMs

CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment

Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field

seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation

M3TR: A Generalist Model for Real-World HD Map Completion

TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving

Scaling and Enhancing LLM-based AVSR: A Sparse Mixture of Projectors Approach

最近の投稿

最近のコメント

アーカイブ

カテゴリー