-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches
要約 このペーパーでは、スケッチベースのクエリ インターフェイスを使用してビデオ … 続きを読む
Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images
要約 機械学習アプローチの開発における長年の課題は、高品質のラベル付きデータが不 … 続きを読む
カテゴリー: cs.CV
Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images はコメントを受け付けていません
Video Anomaly Detection in 10 Years: A Survey and Outlook
要約 ビデオ異常検出 (VAD) は、監視、医療、環境モニタリングなどのさまざま … 続きを読む
カテゴリー: cs.CV
Video Anomaly Detection in 10 Years: A Survey and Outlook はコメントを受け付けていません
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation
要約 このレポートでは、Ego4D チャレンジの 5 トラックと EPIC-Ki … 続きを読む
カテゴリー: cs.CV
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation はコメントを受け付けていません
Long Context Transfer from Language to Vision
要約 ビデオ シーケンスは貴重な時間情報を提供しますが、既存の大規模マルチモーダ … 続きを読む
カテゴリー: cs.CV
Long Context Transfer from Language to Vision はコメントを受け付けていません
Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach
要約 衛星画像 (SAI) におけるシーン グラフ生成 (SGG) は、知覚から … 続きを読む
Deep Active Audio Feature Learning in Resource-Constrained Environments
要約 ラベル付きデータが不足しているため、生体音響アプリケーションでのディープ … 続きを読む
ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation
要約 Image-to-Video (I2V) 生成は、最初のフレームを (テキ … 続きを読む
カテゴリー: cs.CV
ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation はコメントを受け付けていません
DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain
要約 この研究では、高い攻撃成功率 (\textbf{ASR}) と優れた汎用性 … 続きを読む
カテゴリー: cs.CV
DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain はコメントを受け付けていません
SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs
要約 自動運転における軌道予測は、交通参加者、道路トポロジー、交通標識、およびそ … 続きを読む