月別アーカイブ: 2024年7月

SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches

要約 このペーパーでは、スケッチベースのクエリ インターフェイスを使用してビデオ … 続きを読む

カテゴリー: cs.CV, cs.DB, cs.LG | SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches はコメントを受け付けていません

Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images

要約 機械学習アプローチの開発における長年の課題は、高品質のラベル付きデータが不 … 続きを読む

カテゴリー: cs.CV | Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images はコメントを受け付けていません

Video Anomaly Detection in 10 Years: A Survey and Outlook

要約 ビデオ異常検出 (VAD) は、監視、医療、環境モニタリングなどのさまざま … 続きを読む

カテゴリー: cs.CV | Video Anomaly Detection in 10 Years: A Survey and Outlook はコメントを受け付けていません

EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation

要約 このレポートでは、Ego4D チャレンジの 5 トラックと EPIC-Ki … 続きを読む

カテゴリー: cs.CV | EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation はコメントを受け付けていません

Long Context Transfer from Language to Vision

要約 ビデオ シーケンスは貴重な時間情報を提供しますが、既存の大規模マルチモーダ … 続きを読む

カテゴリー: cs.CV | Long Context Transfer from Language to Vision はコメントを受け付けていません

Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach

要約 衛星画像 (SAI) におけるシーン グラフ生成 (SGG) は、知覚から … 続きを読む

カテゴリー: cs.AI, cs.CV | Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach はコメントを受け付けていません

Deep Active Audio Feature Learning in Resource-Constrained Environments

要約 ラベル付きデータが不足しているため、生体音響アプリケーションでのディープ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Deep Active Audio Feature Learning in Resource-Constrained Environments はコメントを受け付けていません

ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation

要約 Image-to-Video (I2V) 生成は、最初のフレームを (テキ … 続きを読む

カテゴリー: cs.CV | ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation はコメントを受け付けていません

DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain

要約 この研究では、高い攻撃成功率 (\textbf{ASR}) と優れた汎用性 … 続きを読む

カテゴリー: cs.CV | DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain はコメントを受け付けていません

SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs

要約 自動運転における軌道予測は、交通参加者、道路トポロジー、交通標識、およびそ … 続きを読む

カテゴリー: cs.CV, cs.RO | SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs はコメントを受け付けていません