-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation
要約 画像のセグメンテーションは視覚の理解において重要な役割を果たします。 最近 … 続きを読む
カテゴリー: cs.CV
SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation はコメントを受け付けていません
xGen-MM (BLIP-3): A Family of Open Large Multimodal Models
要約 このレポートでは、大規模マルチモーダル モデル (LMM) を開発するため … 続きを読む
Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation
要約 この研究では、赤外線小型ターゲット ラベル生成 (IRSTLG) のための … 続きを読む
カテゴリー: cs.CV
Beyond Full Label: Single-Point Prompt for Infrared Small Target Label Generation はコメントを受け付けていません
FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance
要約 モーション豊富で時間的に一貫したビデオを合成することは、特に長時間を扱う場 … 続きを読む
カテゴリー: cs.CV
FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance はコメントを受け付けていません
OC3D: Weakly Supervised Outdoor 3D Object Detection with Only Coarse Click Annotation
要約 LiDAR ベースの屋外 3D 物体検出は広く注目を集めています。 ただし … 続きを読む
WATonoBus: Field-Tested All-Weather Autonomous Shuttle Technology
要約 全天候型の自動運転車の運行には、認識や意思決定から経路計画や制御に至るまで … 続きを読む
Lane Graph as Path: Continuity-preserving Path-wise Modeling for Online Lane Graph Construction
要約 オンライン レーン グラフの構築は、自動運転において有望ではありますが、困 … 続きを読む
GOReloc: Graph-based Object-Level Relocalization for Visual SLAM
要約 この記事では、ロボット システムをオブジェクト レベルで再局所化するための … 続きを読む
Surgical SAM 2: Real-time Segment Anything in Surgical Video by Efficient Frame Pruning
要約 手術ビデオのセグメンテーションは、コンピュータ支援手術における重要なタスク … 続きを読む
DM2RM: Dual-Mode Multimodal Ranking for Target Objects and Receptacles Based on Open-Vocabulary Instructions
要約 この研究では、オープンボキャブラリーの指示に従って、日用品を指定された家具 … 続きを読む