-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
EvGGS: A Collaborative Learning Framework for Event-based Generalizable Gaussian Splatting
要約 イベントカメラは、高ダイナミックレンジや低遅延といった有望な利点を持ち、厳 … 続きを読む
Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification
要約 前立腺がん(PCa)は男性の間で流行している疾患であり、マルチパラメトリッ … 続きを読む
NU-Class Net: A Novel Approach for Video Quality Enhancement
要約 動画コンテンツの人気は急上昇し、インターネットトラフィックやモノのインター … 続きを読む
Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge
要約 大規模言語モデル(LLM)は、Winograd Schema Challe … 続きを読む
VIEScore: Towards Explainable Metrics for Conditional Image Synthesis Evaluation
要約 急速に進展する条件付き画像生成の研究分野において、様々なモデルの性能や能力 … 続きを読む
Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation
要約 最近のオープンボキャブラリーロボットマッピング法は、事前に訓練された視覚言 … 続きを読む
U-DiTs: Downsample Tokens in U-Shaped Diffusion Transformers
要約 拡散トランスフォーマー(DiTs)は、潜空間画像生成のための拡散タスクにト … 続きを読む
カテゴリー: cs.CV
U-DiTs: Downsample Tokens in U-Shaped Diffusion Transformers はコメントを受け付けていません
Addressing Diverging Training Costs using Local Restoration for Precise Bird’s Eye View Map Construction
要約 地図構築のための鳥瞰図(BEV)フュージョンにおける最近の進歩は、都市環境 … 続きを読む
A Stochastic-Geometrical Framework for Object Pose Estimation based on Mixture Models Avoiding the Correspondence Problem
要約 背景剛体物体の姿勢推定は、光学計測やコンピュータビジョンにおける実用的な課 … 続きを読む
ReShader: View-Dependent Highlights for Single Image View-Synthesis
要約 近年、3Dシーン表現と画像インペインティング技術の急速な進歩により、単一画 … 続きを読む