cs.CV」カテゴリーアーカイブ

Can Robots ‘Taste’ Grapes? Estimating SSC with Simple RGB Sensors

要約 生食用ブドウ栽培では、収穫は果実の品質を正確に評価することにかかっています … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | Can Robots ‘Taste’ Grapes? Estimating SSC with Simple RGB Sensors はコメントを受け付けていません

VMix: Improving Text-to-Image Diffusion Model with Cross-Attention Mixing Control

要約 拡散モデルは、テキストから画像への生成において並外れた才能を発揮しますが、 … 続きを読む

カテゴリー: cs.CV | VMix: Improving Text-to-Image Diffusion Model with Cross-Attention Mixing Control はコメントを受け付けていません

Generalize Your Face Forgery Detectors: An Insertable Adaptation Module Is All You Need

要約 顔ディープフェイクのリスクに対処するために、顔偽造検出器が多数存在します。 … 続きを読む

カテゴリー: cs.CV | Generalize Your Face Forgery Detectors: An Insertable Adaptation Module Is All You Need はコメントを受け付けていません

Frequency-aware Event Cloud Network

要約 イベント カメラは、生物学にヒントを得たセンサーであり、驚異的な時間分解能 … 続きを読む

カテゴリー: cs.CV | Frequency-aware Event Cloud Network はコメントを受け付けていません

Two Heads Are Better Than One: Averaging along Fine-Tuning to Improve Targeted Transferability

要約 最適化にかかる時間は非標的型攻撃よりもはるかに長いにもかかわらず、標的型攻 … 続きを読む

カテゴリー: cs.AI, cs.CV | Two Heads Are Better Than One: Averaging along Fine-Tuning to Improve Targeted Transferability はコメントを受け付けていません

DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT

要約 自然言語処理における GPT シリーズなどの自己回帰 (AR) 生成モデル … 続きを読む

カテゴリー: cs.CV | DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT はコメントを受け付けていません

Length-Aware DETR for Robust Moment Retrieval

要約 ビデオ モーメント検索 (MR) は、特定の自然言語クエリに基づいてビデオ … 続きを読む

カテゴリー: cs.AI, cs.CV | Length-Aware DETR for Robust Moment Retrieval はコメントを受け付けていません

TextMatch: Enhancing Image-Text Consistency Through Multimodal Optimization

要約 テキストから画像への生成モデルは、テキストから画像を作成することに優れてい … 続きを読む

カテゴリー: cs.AI, cs.CV | TextMatch: Enhancing Image-Text Consistency Through Multimodal Optimization はコメントを受け付けていません

Fine-Tuning TransMorph with Gradient Correlation for Anatomical Alignment

要約 教師なしディープラーニングは、解剖学的に正確な変換を達成しながら、解剖学的 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Fine-Tuning TransMorph with Gradient Correlation for Anatomical Alignment はコメントを受け付けていません

A Simple Recipe for Contrastively Pre-training Video-First Encoders Beyond 16 Frames

要約 現実世界の長いビデオを理解するには、広範囲にわたる視覚的な依存関係のモデリ … 続きを読む

カテゴリー: cs.CL, cs.CV | A Simple Recipe for Contrastively Pre-training Video-First Encoders Beyond 16 Frames はコメントを受け付けていません