月別アーカイブ: 2025年2月

RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control

要約 カメラトリュームガイド付きの画像からビデオへの最近の進歩により、テキストベ … 続きを読む

カテゴリー: cs.CV | RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control はコメントを受け付けていません

DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery

要約 視覚データは、リモートセンシングから生態学まで、さまざまな科学的ワークフロ … 続きを読む

カテゴリー: cs.CV, cs.LG | DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery はコメントを受け付けていません

Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even Training

要約 命令ガイド付き画像編集は、画像と指示を取り、その命令に従って変更されたその … 続きを読む

カテゴリー: cs.CL, cs.CV | Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even Training はコメントを受け付けていません

HaSPeR: An Image Repository for Hand Shadow Puppet Recognition

要約 ShadowgraphyまたはOmbromanieとも呼ばれるハンドシャド … 続きを読む

カテゴリー: cs.AI, cs.CV | HaSPeR: An Image Repository for Hand Shadow Puppet Recognition はコメントを受け付けていません

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

要約 近年、Wi-Fi Sensingは、プライバシー保護、低コスト、浸透能力な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network はコメントを受け付けていません

City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model

要約 マルチターゲットマルチカメラ追跡(MTMCT)には幅広いアプリケーションが … 続きを読む

カテゴリー: cs.AI, cs.CV | City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model はコメントを受け付けていません

Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations

要約 模倣学習(IL)により、エージェントは報酬シグナルなしで専門家の行動を模倣 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations はコメントを受け付けていません

Anti-Forgetting Adaptation for Unsupervised Person Re-identification

要約 定期的に監視されていないドメイン適応者の再識別(Reid)は、ソースドメイ … 続きを読む

カテゴリー: cs.CV, cs.LG | Anti-Forgetting Adaptation for Unsupervised Person Re-identification はコメントを受け付けていません

Image Embedding Sampling Method for Diverse Captioning

要約 最先端のVLMSの画像キャプションは、時間とともに大幅に改善されました。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Image Embedding Sampling Method for Diverse Captioning はコメントを受け付けていません

Compress image to patches for Vision Transformer

要約 ビジョントランス(VIT)は、コンピュータービジョンの分野で大きな進歩を遂 … 続きを読む

カテゴリー: cs.CV | Compress image to patches for Vision Transformer はコメントを受け付けていません