-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Low-Biased General Annotated Dataset Generation
要約 カテゴリ注釈付きの多数の手動収集画像からなる一般的な注釈付きデータセット( … 続きを読む
カテゴリー: cs.CV
Low-Biased General Annotated Dataset Generation はコメントを受け付けていません
Representation Engineering: A Top-Down Approach to AI Transparency
要約 本稿では、認知神経科学の知見を活用し、AIシステムの透明性を向上させるアプ … 続きを読む
Cross-Spectral Vision Transformer for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern
要約 例えば、顔認証に基づくバイオメトリクスは、顔面マスクの着用により失敗し、指 … 続きを読む
RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning
要約 ロバストな自律走行システムの追求において、実世界のデータセットで学習された … 続きを読む
Locality-aware Gaussian Compression for Fast and High-quality Rendering
要約 我々は、ボリュームシーンのコンパクトなモデリングのために3Dガウシアンの空 … 続きを読む
カテゴリー: cs.CV
Locality-aware Gaussian Compression for Fast and High-quality Rendering はコメントを受け付けていません
ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments
要約 視覚慣性オドメトリ(VIO)は、ロボット、ドローン、自律走行車など様々な分 … 続きを読む
カテゴリー: cs.CV
ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments はコメントを受け付けていません
Doracamom: Joint 3D Detection and Occupancy Prediction with Multi-view 4D Radars and Cameras for Omnidirectional Perception
要約 3次元物体検出と占有予測は、自律走行における重要なタスクであり、大きな注目 … 続きを読む
カテゴリー: cs.CV
Doracamom: Joint 3D Detection and Occupancy Prediction with Multi-view 4D Radars and Cameras for Omnidirectional Perception はコメントを受け付けていません
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation
要約 我々は、地理空間アプリケーションのためのマルチモーダルフレームワーク内でセ … 続きを読む
カテゴリー: cs.CV
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation はコメントを受け付けていません
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction
要約 歩行者の軌跡を正確に予測することは、自律走行の安全性を向上させるために極め … 続きを読む
カテゴリー: cs.CV
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction はコメントを受け付けていません
VoCo-LLaMA: Towards Vision Compression with Large Language Models
要約 視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて目覚ましい成 … 続きを読む
カテゴリー: cs.CV
VoCo-LLaMA: Towards Vision Compression with Large Language Models はコメントを受け付けていません