-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation
要約 我々は、地理空間アプリケーションのためのマルチモーダルフレームワーク内でセ … 続きを読む
カテゴリー: cs.CV
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation はコメントを受け付けていません
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction
要約 歩行者の軌跡を正確に予測することは、自律走行の安全性を向上させるために極め … 続きを読む
カテゴリー: cs.CV
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction はコメントを受け付けていません
VoCo-LLaMA: Towards Vision Compression with Large Language Models
要約 視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて目覚ましい成 … 続きを読む
カテゴリー: cs.CV
VoCo-LLaMA: Towards Vision Compression with Large Language Models はコメントを受け付けていません
HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging
要約 コンピュータビジョンにおけるディープラーニングモデルの大きな成功にもかかわ … 続きを読む
Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations
要約 説明可能なAI(XAI)は、特に画像分類タスクにおいて、顕著性マップによっ … 続きを読む
カテゴリー: cs.CV
Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations はコメントを受け付けていません
EXACFS — A CIL Method to mitigate Catastrophic Forgetting
要約 ディープ・ニューラル・ネットワーク(DNNS)は、静的なデータセットからの … 続きを読む
Improving Representation of High-frequency Components for Medical Visual Foundation Models
要約 基礎モデルは、多様な下流タスクにまたがる優れた一般化可能性から、近年大きな … 続きを読む
Slowing Down Forgetting in Continual Learning
要約 継続学習(CL)における一般的な課題は、新しいタスクを追加学習した後に古い … 続きを読む
TRACE: Temporal Grounding Video LLM via Causal Event Modeling
要約 ビデオ時間接地(VTG)はビデオ理解モデルにとって重要な能力であり、ビデオ … 続きを読む
カテゴリー: cs.CV
TRACE: Temporal Grounding Video LLM via Causal Event Modeling はコメントを受け付けていません
Towards Training One-Step Diffusion Models Without Distillation
要約 ワンステップ生成モデルにおける最近の進歩は、通常2段階のプロセスに従ってい … 続きを読む