I.2.10」カテゴリーアーカイブ

A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction

要約 録画されたビデオから新しいビューを生成することは、自律的なUAVナビゲーシ … 続きを読む

カテゴリー: cs.CV, I.2.10 | A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction はコメントを受け付けていません

Fast 3D point clouds retrieval for Large-scale 3D Place Recognition

要約 3Dポイントクラウドでの検索は、3Dポイントの参照内で最も類似したポイント … 続きを読む

カテゴリー: 68T10, 68T45, cs.CV, cs.IR, I.2.10 | Fast 3D point clouds retrieval for Large-scale 3D Place Recognition はコメントを受け付けていません

Accelerating Model-Based Reinforcement Learning with State-Space World Models

要約 強化学習(RL)は、ロボット学習の強力なアプローチです。 ただし、モデルフ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO, I.2.10, stat.ML | Accelerating Model-Based Reinforcement Learning with State-Space World Models はコメントを受け付けていません

Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation

要約 機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10, stat.ML | Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation はコメントを受け付けていません

A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images

要約 デジタル病理学における臨床的に有用な細胞レベル分析ツールの開発ツールの開発 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images はコメントを受け付けていません

iTrash: Incentivized Token Rewards for Automated Sorting and Handling

要約 ロボットシステム(RS)がより自律的になるにつれて、クリーニング、インフラ … 続きを読む

カテゴリー: cs.AI, cs.ET, cs.RO, I.2.10 | iTrash: Incentivized Token Rewards for Automated Sorting and Handling はコメントを受け付けていません

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

要約 Fiducialマーカーは、さまざまなロボットタスクで広く使用されており、 … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics はコメントを受け付けていません

MOVE: A Mixture-of-Vision-Encoders Approach for Domain-Focused Vision-Language Processing

要約 マルチモーダル言語モデル(MLMS)は、特定のアダプターを介してビジョンエ … 続きを読む

カテゴリー: (Primary), 6804, cs.CV, I.2.10 | MOVE: A Mixture-of-Vision-Encoders Approach for Domain-Focused Vision-Language Processing はコメントを受け付けていません

RGB-Only Gaussian Splatting SLAM for Unbounded Outdoor Scenes

要約 3Dガウススプラッティング(3DG)は、高忠実度の斬新な見解を生み出すこと … 続きを読む

カテゴリー: cs.CV, I.2.10 | RGB-Only Gaussian Splatting SLAM for Unbounded Outdoor Scenes はコメントを受け付けていません

GroundCap: A Visually Grounded Image Captioning Dataset

要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.10 | GroundCap: A Visually Grounded Image Captioning Dataset はコメントを受け付けていません