cs.CV」カテゴリーアーカイブ

SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation

要約 画像のセグメンテーションは視覚の理解において重要な役割を果たします。 最近 … 続きを読む

カテゴリー: cs.CV | SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation はコメントを受け付けていません

xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

要約 このレポートでは、大規模マルチモーダル モデル (LMM) を開発するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | xGen-MM (BLIP-3): A Family of Open Large Multimodal Models はコメントを受け付けていません

Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation

要約 この研究では、赤外線小型ターゲット ラベル生成 (IRSTLG) のための … 続きを読む

カテゴリー: cs.CV | Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation はコメントを受け付けていません

FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance

要約 モーション豊富で時間的に一貫したビデオを合成することは、特に長時間を扱う場 … 続きを読む

カテゴリー: cs.CV | FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance はコメントを受け付けていません

OC3D: Weakly Supervised Outdoor 3D Object Detection with Only Coarse Click Annotation

要約 LiDAR ベースの屋外 3D 物体検出は広く注目を集めています。 ただし … 続きを読む

カテゴリー: cs.AI, cs.CV | OC3D: Weakly Supervised Outdoor 3D Object Detection with Only Coarse Click Annotation はコメントを受け付けていません

WATonoBus: Field-Tested All-Weather Autonomous Shuttle Technology

要約 全天候型の自動運転車の運行には、認識や意思決定から経路計画や制御に至るまで … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | WATonoBus: Field-Tested All-Weather Autonomous Shuttle Technology はコメントを受け付けていません

Lane Graph as Path: Continuity-preserving Path-wise Modeling for Online Lane Graph Construction

要約 オンライン レーン グラフの構築は、自動運転において有望ではありますが、困 … 続きを読む

カテゴリー: cs.CV, cs.RO | Lane Graph as Path: Continuity-preserving Path-wise Modeling for Online Lane Graph Construction はコメントを受け付けていません

GOReloc: Graph-based Object-Level Relocalization for Visual SLAM

要約 この記事では、ロボット システムをオブジェクト レベルで再局所化するための … 続きを読む

カテゴリー: cs.CV, cs.RO | GOReloc: Graph-based Object-Level Relocalization for Visual SLAM はコメントを受け付けていません

Surgical SAM 2: Real-time Segment Anything in Surgical Video by Efficient Frame Pruning

要約 手術ビデオのセグメンテーションは、コンピュータ支援手術における重要なタスク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, eess.IV | Surgical SAM 2: Real-time Segment Anything in Surgical Video by Efficient Frame Pruning はコメントを受け付けていません

DM2RM: Dual-Mode Multimodal Ranking for Target Objects and Receptacles Based on Open-Vocabulary Instructions

要約 この研究では、オープンボキャブラリーの指示に従って、日用品を指定された家具 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | DM2RM: Dual-Mode Multimodal Ranking for Target Objects and Receptacles Based on Open-Vocabulary Instructions はコメントを受け付けていません