-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
Score Distillation via Reparametrized DDIM
要約 2D 拡散モデルはリアルで詳細な画像を生成しますが、これらの 2D 拡散モ … 続きを読む
Multiagent Multitraversal Multimodal Self-Driving: Open MARS Dataset
要約 大規模なデータセットは、AI ベースの自動運転車研究の最近の進歩を促進して … 続きを読む
カテゴリー: cs.CV
Multiagent Multitraversal Multimodal Self-Driving: Open MARS Dataset はコメントを受け付けていません
Reflecting on the State of Rehearsal-free Continual Learning with Pretrained Models
要約 基礎モデルの出現と最近の普及により、継続学習 (CL) は最近、ゼロからの … 続きを読む
Towards Vision-Language Geo-Foundation Model: A Survey
要約 視覚言語基盤モデル (VLFM) は、画像キャプション、画像とテキストの検 … 続きを読む
カテゴリー: cs.CV
Towards Vision-Language Geo-Foundation Model: A Survey はコメントを受け付けていません
SimGen: Simulator-conditioned Driving Scene Generation
要約 制御可能な合成データ生成により、自動運転の研究開発におけるトレーニング デ … 続きを読む
カテゴリー: cs.CV
SimGen: Simulator-conditioned Driving Scene Generation はコメントを受け付けていません
Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition
要約 CLIP などの視覚および言語モデル (VLM) は、驚くべきゼロショット … 続きを読む
Sagiri: Low Dynamic Range Image Enhancement with Generative Diffusion Prior
要約 8 ビット カメラを使用してハイ ダイナミック レンジ (HDR) 風景を … 続きを読む
LLAVIDAL: Benchmarking Large Language Vision Models for Daily Activities of Living
要約 大規模言語視覚モデル (LLVM) は、インターネット ビデオの処理におい … 続きを読む
WonderWorld: Interactive 3D Scene Generation from a Single Image
要約 私たちは、\emph{interactive} 3D シーン外挿のための新 … 続きを読む
Modeling Ambient Scene Dynamics for Free-view Synthesis
要約 単眼でキャプチャした環境シーンを動的に自由にビュー合成して、視聴体験に没入 … 続きを読む
カテゴリー: cs.CV
Modeling Ambient Scene Dynamics for Free-view Synthesis はコメントを受け付けていません