「cs.CV」カテゴリーアーカイブ

Building Rome with Convex Optimization

投稿日: 2025年2月11日作成者: jarxiv

要約グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。（i … 続きを読む →

カテゴリー: cs.CV, cs.RO, math.OC | コメントを受け付けていません

Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images

投稿日: 2025年2月11日作成者: jarxiv

要約拡散モデル（DMS）やビジョン自動回帰モデル（VAR）などの最先端の視覚生 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

投稿日: 2025年2月11日作成者: jarxiv

要約現在のビジョン言語モデル（VLM）は、有害な出力を誘導する悪意のあるプロン … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Kronecker Mask and Interpretive Prompts are Language-Action Video Learners

投稿日: 2025年2月11日作成者: jarxiv

要約対照的な言語イメージの事前削除（CLIP）には、画像ベースのビジョン学習が … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AnyPlace: Learning Generalized Object Placement for Robot Manipulation

投稿日: 2025年2月10日作成者: jarxiv

要約ロボットタスクのオブジェクト配置は、オブジェクトの形状と配置構成の多様性の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Building Rome with Convex Optimization

投稿日: 2025年2月10日作成者: jarxiv

要約グローバルバンドル調整は、深さ予測と凸の最適化により簡単になります。（i … 続きを読む →

カテゴリー: cs.CV, cs.RO, math.OC | コメントを受け付けていません

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

投稿日: 2025年2月10日作成者: jarxiv

要約現在のビジョン言語モデル（VLM）は、有害な出力を誘導する悪意のあるプロン … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Lightweight Operations for Visual Speech Recognition

投稿日: 2025年2月10日作成者: jarxiv

要約ビデオデータから話し言葉を解読する視覚音声認識（VSR）は、特にオーディオ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

ARTInp: CBCT-to-CT Image Inpainting and Image Translation in Radiotherapy

投稿日: 2025年2月10日作成者: jarxiv

要約適応放射線療法（ART）ワークフローの重要なステップは、分娩の精度を確保す … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

A-VL: Adaptive Attention for Large Vision-Language Models

投稿日: 2025年2月10日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLM）は、コンピュータービジョンと自然言語 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Building Rome with Convex Optimization

Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

Kronecker Mask and Interpretive Prompts are Language-Action Video Learners

AnyPlace: Learning Generalized Object Placement for Robot Manipulation

Building Rome with Convex Optimization

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

Lightweight Operations for Visual Speech Recognition

ARTInp: CBCT-to-CT Image Inpainting and Image Translation in Radiotherapy

A-VL: Adaptive Attention for Large Vision-Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー