月別アーカイブ: 2024年5月

Free-Moving Object Reconstruction and Pose Estimation with Virtual Camera

要約 単眼のRGBビデオから自由に動く物体を再構成するアプローチを提案します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Free-Moving Object Reconstruction and Pose Estimation with Virtual Camera はコメントを受け付けていません

Designed Dithering Sign Activation for Binary Neural Networks

要約 バイナリ ニューラル ネットワークは、ネットワークの重みまたはアクティベー … 続きを読む

カテゴリー: cs.CV, cs.LG | Designed Dithering Sign Activation for Binary Neural Networks はコメントを受け付けていません

Composable Part-Based Manipulation

要約 この論文では、ロボット操作スキルの学習と汎用化を向上させるために、オブジェ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Composable Part-Based Manipulation はコメントを受け付けていません

Exploiting Autoencoder’s Weakness to Generate Pseudo Anomalies

要約 異常イベントはまれに発生するため、異常検出の一般的なアプローチは、オートエ … 続きを読む

カテゴリー: cs.CV, cs.LG | Exploiting Autoencoder’s Weakness to Generate Pseudo Anomalies はコメントを受け付けていません

A Comprehensive Survey of Masked Faces: Recognition, Detection, and Unmasking

要約 マスク顔認識 (MFR) は、特にフェイスマスクが広範囲に導入された世界的 … 続きを読む

カテゴリー: cs.CV | A Comprehensive Survey of Masked Faces: Recognition, Detection, and Unmasking はコメントを受け付けていません

Theoretical Guarantees of Data Augmented Last Layer Retraining Methods

要約 トレーニング データ内の多くの異なる部分母集団にわたって公平な予測を保証す … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT, stat.ML | Theoretical Guarantees of Data Augmented Last Layer Retraining Methods はコメントを受け付けていません

Evaluating Real-World Robot Manipulation Policies in Simulation

要約 ロボット工学の分野は、汎用的なロボット操作政策に向けて大きく進歩しました。 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Evaluating Real-World Robot Manipulation Policies in Simulation はコメントを受け付けていません

MRISegmentator-Abdomen: A Fully Automated Multi-Organ and Structure Segmentation Tool for T1-weighted Abdominal MRI

要約 背景: 腹部 MRI における臓器や構造のセグメンテーションは、病気の診断 … 続きを読む

カテゴリー: cs.CV, eess.IV | MRISegmentator-Abdomen: A Fully Automated Multi-Organ and Structure Segmentation Tool for T1-weighted Abdominal MRI はコメントを受け付けていません

Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers

要約 Sora は、任意の解像度、アスペクト比、および継続時間でフォトリアリステ … 続きを読む

カテゴリー: cs.CV | Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers はコメントを受け付けていません

An Embodied Generalist Agent in 3D World

要約 大規模言語モデル (LLM) からの膨大な知識を活用する最近の機械学習モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | An Embodied Generalist Agent in 3D World はコメントを受け付けていません