cs.CV」カテゴリーアーカイブ

ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation

要約 ロボット操作タスクをロボットと環境を関連付ける制約として表すことは、望まし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation はコメントを受け付けていません

Human-in-the-Loop Segmentation of Multi-species Coral Imagery

要約 ロボットの水中および水上探査機による海洋調査では、大量のサンゴ礁画像が得ら … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO | Human-in-the-Loop Segmentation of Multi-species Coral Imagery はコメントを受け付けていません

EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving Planners

要約 現実世界の交通の複雑さに対処するには、自動運転のためのプランナーをデータか … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving Planners はコメントを受け付けていません

Exploring Diverse Methods in Visual Question Answering

要約 この研究では、敵対的生成ネットワーク (GAN)、オートエンコーダー、およ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Exploring Diverse Methods in Visual Question Answering はコメントを受け付けていません

How Does the Textual Information Affect the Retrieval of Multimodal In-Context Learning?

要約 マルチモーダル大規模言語モデル (MLLM) のパラメーター サイズの増加 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | How Does the Textual Information Affect the Retrieval of Multimodal In-Context Learning? はコメントを受け付けていません

OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer

要約 大規模言語モデル (LLM) の最近の進歩により、その機能は包括的なビデオ … 続きを読む

カテゴリー: cs.CL, cs.CV | OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer はコメントを受け付けていません

Exploring Advanced Large Language Models with LLMsuite

要約 このチュートリアルでは、ChatGPT や Gemini などの大規模言語 … 続きを読む

カテゴリー: cs.CL, cs.CV | Exploring Advanced Large Language Models with LLMsuite はコメントを受け付けていません

3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration

要約 マルチインスタンス点群登録は、シーン全体のモデル点群のすべてのインスタンス … 続きを読む

カテゴリー: cs.CV | 3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration はコメントを受け付けていません

Gaussian Process Emulators for Few-Shot Segmentation in Cardiac MRI

要約 心臓磁気共鳴画像 (MRI) のセグメンテーションは、心臓機能の分析と評価 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Gaussian Process Emulators for Few-Shot Segmentation in Cardiac MRI はコメントを受け付けていません

Efficient 3D Perception on Multi-Sweep Point Cloud with Gumbel Spatial Pruning

要約 この論文では、屋外環境における点群の知覚を研究します。 既存の方法では、屋 … 続きを読む

カテゴリー: cs.CV | Efficient 3D Perception on Multi-Sweep Point Cloud with Gumbel Spatial Pruning はコメントを受け付けていません