-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Task Success Prediction and Open-Vocabulary Object Manipulation
要約 この研究は、オープン語彙オブジェクト操作の将来の成功または失敗を予測するよ … 続きを読む
SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control
要約 自動運転の進歩は、大規模な注釈付きデータセットに依存しています。 この研究 … 続きを読む
LiHi-GS: LiDAR-Supervised Gaussian Splatting for Highway Driving Scene Reconstruction
要約 フォトリアリスティックな 3D シーンの再構築は自動運転において重要な役割 … 続きを読む
ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning
要約 取得したデータを使用した最近の軽量画像キャプション モデルは、主にテキスト … 続きを読む
LMFusion: Adapting Pretrained Language Models for Multimodal Generation
要約 LMFusion は、事前トレーニング済みのテキスト専用大規模言語モデル … 続きを読む
World-to-Words: Grounded Open Vocabulary Acquisition through Fast Mapping in Vision-Language Models
要約 言語単位を物理世界の指示対象に接続する能力 (グラウンディングと呼ばれます … 続きを読む
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence
要約 大規模ビジョン言語モデル (LVLM) は、大規模言語モデル (LLM) … 続きを読む
Dust to Tower: Coarse-to-Fine Photo-Realistic Scene Reconstruction from Sparse Uncalibrated Images
要約 実際には、まばらなビューのキャリブレーションされていない画像から写真のよう … 続きを読む
カテゴリー: cs.CV
Dust to Tower: Coarse-to-Fine Photo-Realistic Scene Reconstruction from Sparse Uncalibrated Images はコメントを受け付けていません
Attribution for Enhanced Explanation with Transferable Adversarial eXploration
要約 ディープ ニューラル ネットワークの解釈可能性は、コンピューター ビジョン … 続きを読む
Diffusion Models Learn Low-Dimensional Distributions via Subspace Clustering
要約 最近の実証研究では、拡散モデルが画像分布を効果的に学習し、新しいサンプルを … 続きを読む