「cs.CV」カテゴリーアーカイブ

EqNIO: Subequivariant Neural Inertial Odometry

投稿日: 2024年8月13日作成者: jarxiv

要約現在、ニューラルネットワークは、慣性測定ユニット (IMU) データから … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents

投稿日: 2024年8月13日作成者: jarxiv

要約大規模マルチモーダルモデル (LMM) は、言語と視覚の両方の機能を統合 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

HeLiMOS: A Dataset for Moving Object Segmentation in 3D Point Clouds From Heterogeneous LiDAR Sensors

投稿日: 2024年8月13日作成者: jarxiv

要約 3D 光検出測距 (LiDAR) センサーを使用した移動物体セグメンテーシ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Moo-ving Beyond Tradition: Revolutionizing Cattle Behavioural Phenotyping with Pose Estimation Techniques

投稿日: 2024年8月13日作成者: jarxiv

要約畜牛産業は、米国やカナダを含む多くの国の経済に大きく貢献してきました。人 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Visual Representation Learning with Stochastic Frame Prediction

投稿日: 2024年8月12日作成者: jarxiv

要約将来のフレームを予測することによる画像表現の自己教師あり学習は有望な方向性 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Embodied Uncertainty-Aware Object Segmentation

投稿日: 2024年8月12日作成者: jarxiv

要約不確実性を認識したオブジェクトインスタンスセグメンテーション (Unc … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation

投稿日: 2024年8月12日作成者: jarxiv

要約私たちは、ゼロショットのロボット操作、つまりテスト時の適応なしで新しいシー … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Diffusion Reward: Learning Rewards via Conditional Video Diffusion

投稿日: 2024年8月12日作成者: jarxiv

要約エキスパートビデオからの学習報酬は、強化学習 (RL) タスクの意図され … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Towards Consistent Object Detection via LiDAR-Camera Synergy

投稿日: 2024年8月12日作成者: jarxiv

要約人間と機械の相互作用が進化し続けるにつれて、環境を認識する能力がますます重 … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

Surveying the Landscape of Image Captioning Evaluation: A Comprehensive Taxonomy and Novel Ensemble Method

投稿日: 2024年8月12日作成者: jarxiv

要約画像キャプションのタスクは最近人気が高まっており、それに伴い、画像キャプシ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

EqNIO: Subequivariant Neural Inertial Odometry

VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents

HeLiMOS: A Dataset for Moving Object Segmentation in 3D Point Clouds From Heterogeneous LiDAR Sensors

Moo-ving Beyond Tradition: Revolutionizing Cattle Behavioural Phenotyping with Pose Estimation Techniques

Visual Representation Learning with Stochastic Frame Prediction

Embodied Uncertainty-Aware Object Segmentation

Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation

Diffusion Reward: Learning Rewards via Conditional Video Diffusion

Towards Consistent Object Detection via LiDAR-Camera Synergy

Surveying the Landscape of Image Captioning Evaluation: A Comprehensive Taxonomy and Novel Ensemble Method

最近の投稿

最近のコメント

アーカイブ

カテゴリー