月別アーカイブ: 2025年3月

Low-Biased General Annotated Dataset Generation

要約 カテゴリ注釈付きの多数の手動収集画像からなる一般的な注釈付きデータセット( … 続きを読む

カテゴリー: cs.CV | Low-Biased General Annotated Dataset Generation はコメントを受け付けていません

Representation Engineering: A Top-Down Approach to AI Transparency

要約 本稿では、認知神経科学の知見を活用し、AIシステムの透明性を向上させるアプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Representation Engineering: A Top-Down Approach to AI Transparency はコメントを受け付けていません

Cross-Spectral Vision Transformer for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern

要約 例えば、顔認証に基づくバイオメトリクスは、顔面マスクの着用により失敗し、指 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Cross-Spectral Vision Transformer for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern はコメントを受け付けていません

RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning

要約 ロバストな自律走行システムの追求において、実世界のデータセットで学習された … 続きを読む

カテゴリー: cs.AI, cs.CV | RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning はコメントを受け付けていません

Locality-aware Gaussian Compression for Fast and High-quality Rendering

要約 我々は、ボリュームシーンのコンパクトなモデリングのために3Dガウシアンの空 … 続きを読む

カテゴリー: cs.CV | Locality-aware Gaussian Compression for Fast and High-quality Rendering はコメントを受け付けていません

ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments

要約 視覚慣性オドメトリ(VIO)は、ロボット、ドローン、自律走行車など様々な分 … 続きを読む

カテゴリー: cs.CV | ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments はコメントを受け付けていません

Doracamom: Joint 3D Detection and Occupancy Prediction with Multi-view 4D Radars and Cameras for Omnidirectional Perception

要約 3次元物体検出と占有予測は、自律走行における重要なタスクであり、大きな注目 … 続きを読む

カテゴリー: cs.CV | Doracamom: Joint 3D Detection and Occupancy Prediction with Multi-view 4D Radars and Cameras for Omnidirectional Perception はコメントを受け付けていません

CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation

要約 我々は、地理空間アプリケーションのためのマルチモーダルフレームワーク内でセ … 続きを読む

カテゴリー: cs.CV | CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation はコメントを受け付けていません

GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction

要約 歩行者の軌跡を正確に予測することは、自律走行の安全性を向上させるために極め … 続きを読む

カテゴリー: cs.CV | GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction はコメントを受け付けていません

VoCo-LLaMA: Towards Vision Compression with Large Language Models

要約 視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて目覚ましい成 … 続きを読む

カテゴリー: cs.CV | VoCo-LLaMA: Towards Vision Compression with Large Language Models はコメントを受け付けていません