cs.CV」カテゴリーアーカイブ

Building Rome with Convex Optimization

要約 グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。 (i … 続きを読む

カテゴリー: cs.CV, cs.RO, math.OC | Building Rome with Convex Optimization はコメントを受け付けていません

Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images

要約 拡散モデル(DMS)やビジョン自動回帰モデル(VAR)などの最先端の視覚生 … 続きを読む

カテゴリー: cs.CV | Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images はコメントを受け付けていません

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

要約 現在のビジョン言語モデル(VLM)は、有害な出力を誘導する悪意のあるプロン … 続きを読む

カテゴリー: cs.CL, cs.CV | ELITE: Enhanced Language-Image Toxicity Evaluation for Safety はコメントを受け付けていません

Kronecker Mask and Interpretive Prompts are Language-Action Video Learners

要約 対照的な言語イメージの事前削除(CLIP)には、画像ベースのビジョン学習が … 続きを読む

カテゴリー: cs.CV | Kronecker Mask and Interpretive Prompts are Language-Action Video Learners はコメントを受け付けていません

AnyPlace: Learning Generalized Object Placement for Robot Manipulation

要約 ロボットタスクのオブジェクト配置は、オブジェクトの形状と配置構成の多様性の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | AnyPlace: Learning Generalized Object Placement for Robot Manipulation はコメントを受け付けていません

Building Rome with Convex Optimization

要約 グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。 (i … 続きを読む

カテゴリー: cs.CV, cs.RO, math.OC | Building Rome with Convex Optimization はコメントを受け付けていません

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

要約 現在のビジョン言語モデル(VLM)は、有害な出力を誘導する悪意のあるプロン … 続きを読む

カテゴリー: cs.CL, cs.CV | ELITE: Enhanced Language-Image Toxicity Evaluation for Safety はコメントを受け付けていません

Lightweight Operations for Visual Speech Recognition

要約 ビデオデータから話し言葉を解読する視覚音声認識(VSR)は、特にオーディオ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Lightweight Operations for Visual Speech Recognition はコメントを受け付けていません

ARTInp: CBCT-to-CT Image Inpainting and Image Translation in Radiotherapy

要約 適応放射線療法(ART)ワークフローの重要なステップは、分娩の精度を確保す … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | ARTInp: CBCT-to-CT Image Inpainting and Image Translation in Radiotherapy はコメントを受け付けていません

A-VL: Adaptive Attention for Large Vision-Language Models

要約 大規模なビジョン言語モデル(LVLM)は、コンピュータービジョンと自然言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | A-VL: Adaptive Attention for Large Vision-Language Models はコメントを受け付けていません