-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions
要約 一般的な環境を積極的に探索しながら、任意のオブジェクトを説明する際のエージ … 続きを読む
Datasets for Lane Detection in Autonomous Driving: A Comprehensive Review
要約 自動化された運転には正確な車線検出が不可欠であり、さまざまな道路シナリオで … 続きを読む
カテゴリー: cs.CV
Datasets for Lane Detection in Autonomous Driving: A Comprehensive Review はコメントを受け付けていません
Digital Twin Catalog: A Large-Scale Photorealistic 3D Object Digital Twin Dataset
要約 デジタルツインカタログ(DTC)を紹介します。これは、新しい大規模なフォト … 続きを読む
Discriminator-Free Direct Preference Optimization for Video Diffusion
要約 直接選好最適化(DPO)は、WIN/LOSITデータペアを通じてモデルを人 … 続きを読む
カテゴリー: cs.CV
Discriminator-Free Direct Preference Optimization for Video Diffusion はコメントを受け付けていません
Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection
要約 ディープフェイクの顔の急増は、私たちの日常生活に大きな潜在的な悪影響をもた … 続きを読む
カテゴリー: cs.CV
Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection はコメントを受け付けていません
COP-GEN-Beta: Unified Generative Modelling of COPernicus Imagery Thumbnails
要約 リモートセンシングでは、同じシーンをキャプチャするさまざまなセンサーのマル … 続きを読む
Proxy-Anchor and EVT-Driven Continual Learning Method for Generalized Category Discovery
要約 継続的な一般化されたカテゴリの発見が、以前に学んだカテゴリの壊滅的な忘却を … 続きを読む
Shadow Erosion and Nighttime Adaptability for Camera-Based Automated Driving Applications
要約 RGBカメラからの画像の強化は、医療イメージング、衛星イメージング、自動運 … 続きを読む
カテゴリー: cs.CV
Shadow Erosion and Nighttime Adaptability for Camera-Based Automated Driving Applications はコメントを受け付けていません
F-LMM: Grounding Frozen Large Multimodal Models
要約 視覚的な接地能力を備えた大規模なマルチモーダルモデル(LMM)を支えると、 … 続きを読む
カテゴリー: cs.CV
F-LMM: Grounding Frozen Large Multimodal Models はコメントを受け付けていません
Banana Ripeness Level Classification using a Simple CNN Model Trained with Real and Synthetic Datasets
要約 熟度のレベルは、バナナの品質を決定するのに不可欠です。 バナナの成熟度を正 … 続きを読む