cs.CV」カテゴリーアーカイブ

BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation

要約 テキストツービデオ(T2V)の生成モデルは、急速に進歩し、エンターテイメン … 続きを読む

カテゴリー: cs.AI, cs.CV | BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation はコメントを受け付けていません

DreamO: A Unified Framework for Image Customization

要約 最近、画像のカスタマイズに関する広範な研究(例:アイデンティティ、主題、ス … 続きを読む

カテゴリー: cs.CV | DreamO: A Unified Framework for Image Customization はコメントを受け付けていません

DiffArtist: Towards Structure and Appearance Controllable Image Stylization

要約 芸術的なスタイルには、構造要素と外観の両方の要素が含まれます。 既存のニュ … 続きを読む

カテゴリー: cs.CV, cs.GR | DiffArtist: Towards Structure and Appearance Controllable Image Stylization はコメントを受け付けていません

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

要約 ビジョン言語モデル(VLM)は、マルチモーダル推論タスクの顕著な進歩を示し … 続きを読む

カテゴリー: cs.CL, cs.CV | Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning はコメントを受け付けていません

A Survey on Mixup Augmentations and Beyond

要約 深いニューラルネットワークが過去10年間でスリリングなブレークスルーを達成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Survey on Mixup Augmentations and Beyond はコメントを受け付けていません

Generalized Neighborhood Attention: Multi-dimensional Sparse Attention at the Speed of Light

要約 近隣の注意などの多くのまばらな注意メカニズムは、通常、自己注意ベースライン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Generalized Neighborhood Attention: Multi-dimensional Sparse Attention at the Speed of Light はコメントを受け付けていません

I-Con: A Unifying Framework for Representation Learning

要約 表現学習の分野が成長するにつれて、さまざまなクラスの問題を解決するために、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, math.IT | I-Con: A Unifying Framework for Representation Learning はコメントを受け付けていません

Procedural Dataset Generation for Zero-Shot Stereo Matching

要約 合成データセットは、ステレオマッチングネットワークをトレーニングするための … 続きを読む

カテゴリー: cs.CV | Procedural Dataset Generation for Zero-Shot Stereo Matching はコメントを受け付けていません

EvTTC: An Event Camera Dataset for Time-to-Collision Estimation

要約 衝突までの時間(TTC)の推定は、すべての自動緊急ブレーキ(AEB)システ … 続きを読む

カテゴリー: cs.CV, cs.RO | EvTTC: An Event Camera Dataset for Time-to-Collision Estimation はコメントを受け付けていません

MedNNS: Supernet-based Medical Task-Adaptive Neural Network Search

要約 ディープラーニング(DL)は、医療イメージングの分野で顕著な進歩を遂げまし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MedNNS: Supernet-based Medical Task-Adaptive Neural Network Search はコメントを受け付けていません