cs.CV」カテゴリーアーカイブ

Robotic framework for autonomous manipulation of laboratory equipment with different degrees of transparency via 6D pose estimation

要約 現代のロボット システムの多くは自律的に動作しますが、環境を正確に分析して … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SE, cs.SY, eess.SY | Robotic framework for autonomous manipulation of laboratory equipment with different degrees of transparency via 6D pose estimation はコメントを受け付けていません

LaB-CL: Localized and Balanced Contrastive Learning for improving parking slot detection

要約 駐車スロット検出は、自動駐車システムに不可欠な技術です。 一般に、駐車枠検 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | LaB-CL: Localized and Balanced Contrastive Learning for improving parking slot detection はコメントを受け付けていません

RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation

要約 ロボット工学では両手操作が不可欠ですが、2 つのロボット アームを調整する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation はコメントを受け付けていません

Understanding Spatio-Temporal Relations in Human-Object Interaction using Pyramid Graph Convolutional Network

要約 人間のアクティビティの認識は、知能ロボットにとって重要なタスクです。特に人 … 続きを読む

カテゴリー: cs.CV, cs.RO | Understanding Spatio-Temporal Relations in Human-Object Interaction using Pyramid Graph Convolutional Network はコメントを受け付けていません

Understanding Human Activity with Uncertainty Measure for Novelty in Graph Convolutional Networks

要約 人間の活動を理解することは、特に人間とロボットのコラボレーションの分野にお … 続きを読む

カテゴリー: cs.CV, cs.RO | Understanding Human Activity with Uncertainty Measure for Novelty in Graph Convolutional Networks はコメントを受け付けていません

Multimodal Perception System for Real Open Environment

要約 この論文では、実際のオープン環境向けの新しいマルチモーダル知覚システムを紹 … 続きを読む

カテゴリー: cs.CV, cs.RO | Multimodal Perception System for Real Open Environment はコメントを受け付けていません

DragTraffic: Interactive and Controllable Traffic Scene Generation for Autonomous Driving

要約 自動運転システムの評価とトレーニングには、多様でスケーラブルなコーナーケー … 続きを読む

カテゴリー: cs.CV, cs.RO | DragTraffic: Interactive and Controllable Traffic Scene Generation for Autonomous Driving はコメントを受け付けていません

TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning

要約 モデルがテレビ クリップなどの複雑でマルチモーダルなコンテンツを理解するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning はコメントを受け付けていません

Scaling Up Your Kernels: Large Kernel Design in ConvNets towards Universal Representations

要約 この論文では、最新の畳み込みニューラル ネットワーク (ConvNet) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Scaling Up Your Kernels: Large Kernel Design in ConvNets towards Universal Representations はコメントを受け付けていません

A framework for compressing unstructured scientific data via serialization

要約 既知のローカル接続を使用して非構造化科学データを圧縮するための一般的なフレ … 続きを読む

カテゴリー: cs.CV | A framework for compressing unstructured scientific data via serialization はコメントを受け付けていません