-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2023年8月
SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection
要約 さまざまなモダリティからの画像が特徴抽出のための独自の情報を提供するため、 … 続きを読む
カテゴリー: cs.CV
SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection はコメントを受け付けていません
ToonTalker: Cross-Domain Face Reenactment
要約 この論文では、クロスドメインの顔の再現、つまり、漫画の画像と実際の人物のビ … 続きを読む
カテゴリー: cs.CV
ToonTalker: Cross-Domain Face Reenactment はコメントを受け付けていません
MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online Neural RGB-D Reconstruction
要約 新しいニューラル暗黙的表現であるマルチ暗黙的サブマップに基づいた、堅牢でス … 続きを読む
VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition
要約 LiDAR ベースの場所認識は、同時位置特定とマッピング (SLAM) お … 続きを読む
カテゴリー: cs.CV
VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition はコメントを受け付けていません
Multi-stage feature decorrelation constraints for improving CNN classification performance
要約 パターン分類に使用される畳み込みニューラル ネットワーク (CNN) の場 … 続きを読む
カテゴリー: cs.CV
Multi-stage feature decorrelation constraints for improving CNN classification performance はコメントを受け付けていません
Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings
要約 セマンティック セグメンテーションは、ラベルを画像内の各ピクセルに関連付け … 続きを読む
カテゴリー: cs.CV
Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings はコメントを受け付けていません
Beyond Document Page Classification: Design, Datasets, and Challenges
要約 このペーパーでは、テストされるデータの性質 ($X$: マルチチャネル、マ … 続きを読む
Multimodal Image Synthesis and Editing: The Generative AI Era
要約 実世界では情報がさまざまなモダリティで存在するため、マルチモーダル情報間の … 続きを読む
カテゴリー: cs.CV
Multimodal Image Synthesis and Editing: The Generative AI Era はコメントを受け付けていません
Can Linguistic Knowledge Improve Multimodal Alignment in Vision-Language Pretraining?
要約 マルチメディア コミュニティは、マルチモーダルな事前学習済みニューラル ネ … 続きを読む
Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction
要約 単一ビューの RGB 画像を実際にキャリブレーションするのは難しいため、既 … 続きを読む
カテゴリー: cs.CV
Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction はコメントを受け付けていません