「cs.LG」カテゴリーアーカイブ

ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish

投稿日: 2025年3月5日作成者: jarxiv

要約データ駆動型のベンチマークは、気象や構造生物学を含む主要な科学モデリングド … 続きを読む →

カテゴリー: cs.CV, cs.LG, q-bio.NC | コメントを受け付けていません

Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?

投稿日: 2025年3月5日作成者: jarxiv

要約 3D認識タスクでのデータ収集と注釈に必要な努力により、既存のデータを混合す … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points

投稿日: 2025年3月5日作成者: jarxiv

要約アーキテクチャプログラムに基づいて構築された新しい学習フレームワークである … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation

投稿日: 2025年3月5日作成者: jarxiv

要約 Vila-Uは、ビデオ、画像、言語の理解、および生成を統合する統合された基 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

投稿日: 2025年3月5日作成者: jarxiv

要約視覚的な質問応答（VQA）は、コンピュータービジョンと自然言語処理の交差点 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | コメントを受け付けていません

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

投稿日: 2025年3月5日作成者: jarxiv

要約拡散トランスは、テキスト間合成に広く採用されています。これらのモデルを数 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

AI-based association analysis for medical imaging using latent-space geometric confounder correction

投稿日: 2025年3月5日作成者: jarxiv

要約この研究では、人工知能ベースの医療画像分析における交絡効果と解釈可能性の課 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Variational Best-of-N Alignment

投稿日: 2025年3月5日作成者: jarxiv

要約 Best-of-n（bon）は、言語モデルを人間の好みに合わせるための一般 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos

投稿日: 2025年3月4日作成者: jarxiv

要約本研究では、多指ロボットハンドが多様な姿勢で多様な物体を操作するための、視 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Leray-Schauder Mappings for Operator Learning

投稿日: 2025年3月4日作成者: jarxiv

要約コンパクトな部分空間の有限次元近似を学習するためのLeray-Schaud … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish

Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?

ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

AI-based association analysis for medical imaging using latent-space geometric confounder correction

Variational Best-of-N Alignment

ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos

Leray-Schauder Mappings for Operator Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー