月別アーカイブ: 2023年3月

AutoFed: Heterogeneity-Aware Federated Multimodal Learning for Robust Autonomous Driving

要約 車載センサー (ライダー、レーダー、カメラなど) による物体検出は、自動運

3D Line Mapping Revisited

要約 まばらなキーポイントとは対照的に、いくつかの線分は主な構造要素を描写するこ

Learning in Factored Domains with Information-Constrained Visual Representations

要約 人間は、複雑な視覚情報を含むタスクであってもすぐに学習します。 これは、視

Hindi as a Second Language: Improving Visually Grounded Speech with Semantically Similar Samples

要約 この作業の目的は、多言語の観点から視覚的に接地された音声モデル (VGS)

CAusal and collaborative proxy-tasKs lEarning for Semi-Supervised Domain Adaptation

要約 半教師ありドメイン適応 (SSDA) は、ソース ドメイン データといくつ

Asymmetric Face Recognition with Cross Model Compatible Ensembles

要約 非対称検索設定は、リソースに制約のある顔認識に適したソリューションです。

Joint-MAE: 2D-3D Joint Masked Autoencoders for 3D Point Cloud Pre-training

要約 マスク オートエンコーダー (MAE) は、2D と 3D の両方のコンピ

Sigmoid Loss for Language Image Pre-Training

要約 画像とテキストの事前トレーニングのための単純なペアワイズ シグモイド損失を

Co-manipulation of soft-materials estimating deformation from depth images

要約 布地、複合材、紙/段ボールのシートなどの柔らかい素材の人間とロボットの共同

PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models

要約 拡散モデルを使用した画像編集は、最近非常に急速な成長を遂げています。 以前

