-
最近の投稿
- BlabberSeg: Real-Time Embedded Open-Vocabulary Aerial Segmentation
- Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks
- Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation
- Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation
- RPCBF: Constructing Safety Filters Robust to Model Error and Disturbances via Policy Control Barrier Functions
-
最近のコメント
表示できるコメントはありません。 cs.AI (28260) cs.CL (21356) cs.CR (2207) cs.CV (34912) cs.LG (33009) cs.RO (16270) cs.SY (2503) eess.IV (4251) eess.SY (2497) stat.ML (4424)
月別アーカイブ: 2024年6月
Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs
要約 人間の嗜好データに基づいてトレーニングされた報酬モデルは、人間のフィードバ … 続きを読む
COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning
要約 音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む
Quantifying Variance in Evaluation Benchmarks
要約 評価ベンチマークは、大規模言語モデル (LLM) の機能を測定するための基 … 続きを読む
GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation
要約 この論文では、一般化可能なビジョンベースの人間からロボットへの (H2R) … 続きを読む
Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement
要約 目的: 目の形態、特に眼窩と視神経は集団によって大きく異なります。 これら … 続きを読む
First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) テクノロジーの開発により、そ … 続きを読む
DurLAR: A High-fidelity 128-channel LiDAR Dataset with Panoramic Ambient and Reflectivity Imagery for Multi-modal Autonomous Driving Applications
要約 パノラマ環境 (近赤外線) および反射率画像を備えた高忠実度 128 チャ … 続きを読む
Long-Tailed 3D Detection via 2D Late Fusion
要約 Long-Tailed 3D Object Detection (LT3D … 続きを読む
Perturbing Attention Gives You More Bang for the Buck: Subtle Imaging Perturbations That Efficiently Fool Customized Diffusion Models
要約 拡散モデル (DM) は生成モデリングの新時代を迎え、高品質で現実的なデー … 続きを読む
Enhancing Vision-Language Model with Unmasked Token Alignment
要約 CLIP に代表される、画像とテキストのペアに関する対照的な事前トレーニン … 続きを読む
カテゴリー: cs.CV
Enhancing Vision-Language Model with Unmasked Token Alignment はコメントを受け付けていません