-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Building Rome with Convex Optimization
要約 グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。 (i … 続きを読む
Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images
要約 拡散モデル(DMS)やビジョン自動回帰モデル(VAR)などの最先端の視覚生 … 続きを読む
カテゴリー: cs.CV
Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images はコメントを受け付けていません
ELITE: Enhanced Language-Image Toxicity Evaluation for Safety
要約 現在のビジョン言語モデル(VLM)は、有害な出力を誘導する悪意のあるプロン … 続きを読む
Kronecker Mask and Interpretive Prompts are Language-Action Video Learners
要約 対照的な言語イメージの事前削除(CLIP)には、画像ベースのビジョン学習が … 続きを読む
カテゴリー: cs.CV
Kronecker Mask and Interpretive Prompts are Language-Action Video Learners はコメントを受け付けていません
AnyPlace: Learning Generalized Object Placement for Robot Manipulation
要約 ロボットタスクのオブジェクト配置は、オブジェクトの形状と配置構成の多様性の … 続きを読む
Building Rome with Convex Optimization
要約 グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。 (i … 続きを読む
ELITE: Enhanced Language-Image Toxicity Evaluation for Safety
要約 現在のビジョン言語モデル(VLM)は、有害な出力を誘導する悪意のあるプロン … 続きを読む
Lightweight Operations for Visual Speech Recognition
要約 ビデオデータから話し言葉を解読する視覚音声認識(VSR)は、特にオーディオ … 続きを読む
ARTInp: CBCT-to-CT Image Inpainting and Image Translation in Radiotherapy
要約 適応放射線療法(ART)ワークフローの重要なステップは、分娩の精度を確保す … 続きを読む
A-VL: Adaptive Attention for Large Vision-Language Models
要約 大規模なビジョン言語モデル(LVLM)は、コンピュータービジョンと自然言語 … 続きを読む