月別アーカイブ: 2025年3月

Scale Efficient Training for Large Datasets

投稿日: 2025年3月18日作成者: jarxiv

要約データセットスケールの急速な成長は、深い学習研究を進めるための重要な要因と … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

MicroVQA: A Multimodal Reasoning Benchmark for Microscopy-Based Scientific Research

投稿日: 2025年3月18日作成者: jarxiv

要約科学研究には、マルチモーダルデータよりも洗練された推論が必要です。これは、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, q-bio.CB | コメントを受け付けていません

U2AD: Uncertainty-based Unsupervised Anomaly Detection Framework for Detecting T2 Hyperintensity in MRI Spinal Cord

投稿日: 2025年3月18日作成者: jarxiv

要約脊髄MR画像のT2高強度は、変性頸部骨髄障害などの条件のための重要なバイオ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

投稿日: 2025年3月18日作成者: jarxiv

要約データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Video-Guided Foley Sound Generation with Multimodal Controls

投稿日: 2025年3月18日作成者: jarxiv

要約ビデオのサウンドエフェクトを生成するには、多くの場合、実生活のソースとサウ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

CLIP’s Visual Embedding Projector is a Few-shot Cornucopia

投稿日: 2025年3月18日作成者: jarxiv

要約少数のショット分類のために、Clip（Radford et al。、202 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation

投稿日: 2025年3月18日作成者: jarxiv

要約具体化されたAIに関連する複数のタスクには、高品質の大規模な明確なオブジェ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis

投稿日: 2025年3月18日作成者: jarxiv

要約通常、最近の画像生成スキームは、凍結画像トークネイザーに依存して、事前に構 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes

投稿日: 2025年3月18日作成者: jarxiv

要約特にハイステークスアプリケーションでのニューラルネットワークの増加に伴い、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction

投稿日: 2025年3月18日作成者: jarxiv

要約自律運転には、レーンや横断歩道などのインフラストラクチャ要素を理解する必要 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

月別アーカイブ: 2025年3月

Scale Efficient Training for Large Datasets

MicroVQA: A Multimodal Reasoning Benchmark for Microscopy-Based Scientific Research

U2AD: Uncertainty-based Unsupervised Anomaly Detection Framework for Detecting T2 Hyperintensity in MRI Spinal Cord

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

Video-Guided Foley Sound Generation with Multimodal Controls

CLIP’s Visual Embedding Projector is a Few-shot Cornucopia

Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation

Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis

Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes

AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction

最近の投稿

最近のコメント

アーカイブ

カテゴリー