cs.LG」カテゴリーアーカイブ

A Practitioner’s Guide to Continual Multimodal Pretraining

要約 マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Practitioner’s Guide to Continual Multimodal Pretraining はコメントを受け付けていません

CompCap: Improving Multimodal Large Language Models with Composite Captions

要約 マルチモーダル大規模言語モデル (MLLM) は合成画像をどの程度理解でき … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CompCap: Improving Multimodal Large Language Models with Composite Captions はコメントを受け付けていません

From classical techniques to convolution-based models: A review of object detection algorithms

要約 オブジェクト検出は、コンピューター ビジョンと画像理解における基本的なタス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | From classical techniques to convolution-based models: A review of object detection algorithms はコメントを受け付けていません

Extrapolated Urban View Synthesis Benchmark

要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Extrapolated Urban View Synthesis Benchmark はコメントを受け付けていません

Sparse autoencoders reveal selective remapping of visual concepts during adaptation

要約 基礎モデルを特定の目的に適合させることは、下流アプリケーション用の機械学習 … 続きを読む

カテゴリー: cs.CV, cs.LG | Sparse autoencoders reveal selective remapping of visual concepts during adaptation はコメントを受け付けていません

Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model

要約 現実的な自動運転シミュレーターの開発には4D運転シミュレーションが不可欠で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model はコメントを受け付けていません

EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding

要約 3D 占有予測は周囲のシーンの包括的な説明を提供し、3D 認識にとって不可 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding はコメントを受け付けていません

GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction はコメントを受け付けていません

From interpretability to inference: an estimation framework for universal approximators

要約 私たちは、広範なクラスの汎用近似器を使用した推定と推論のための新しいフレー … 続きを読む

カテゴリー: 62-07, 62G10, 62G20, 91-08, 91A12, cs.LG, econ.EM, G.3, stat.ML | From interpretability to inference: an estimation framework for universal approximators はコメントを受け付けていません

Learning Speed-Adaptive Walking Agent Using Imitation Learning with Physics-Informed Simulation

要約 人間の歩行の仮想モデル、つまりデジタル ツインは、労働集約的なデータ収集を … 続きを読む

カテゴリー: cs.LG, cs.RO | Learning Speed-Adaptive Walking Agent Using Imitation Learning with Physics-Informed Simulation はコメントを受け付けていません