月別アーカイブ: 2025年2月

RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control

投稿日: 2025年2月17日作成者: jarxiv

要約カメラトリュームガイド付きの画像からビデオへの最近の進歩により、テキストベ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery

投稿日: 2025年2月17日作成者: jarxiv

要約視覚データは、リモートセンシングから生態学まで、さまざまな科学的ワークフロ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even Training

投稿日: 2025年2月17日作成者: jarxiv

要約命令ガイド付き画像編集は、画像と指示を取り、その命令に従って変更されたその … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

HaSPeR: An Image Repository for Hand Shadow Puppet Recognition

投稿日: 2025年2月17日作成者: jarxiv

要約 ShadowgraphyまたはOmbromanieとも呼ばれるハンドシャド … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

投稿日: 2025年2月17日作成者: jarxiv

要約近年、Wi-Fi Sensingは、プライバシー保護、低コスト、浸透能力な … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | コメントを受け付けていません

City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model

投稿日: 2025年2月17日作成者: jarxiv

要約マルチターゲットマルチカメラ追跡（MTMCT）には幅広いアプリケーションが … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations

投稿日: 2025年2月17日作成者: jarxiv

要約模倣学習（IL）により、エージェントは報酬シグナルなしで専門家の行動を模倣 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Anti-Forgetting Adaptation for Unsupervised Person Re-identification

投稿日: 2025年2月17日作成者: jarxiv

要約定期的に監視されていないドメイン適応者の再識別（Reid）は、ソースドメイ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Image Embedding Sampling Method for Diverse Captioning

投稿日: 2025年2月17日作成者: jarxiv

要約最先端のVLMSの画像キャプションは、時間とともに大幅に改善されました。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Compress image to patches for Vision Transformer

投稿日: 2025年2月17日作成者: jarxiv

要約ビジョントランス（VIT）は、コンピュータービジョンの分野で大きな進歩を遂 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年2月

RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control

DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery

Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even Training

HaSPeR: An Image Repository for Hand Shadow Puppet Recognition

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model

Domain-Invariant Per-Frame Feature Extraction for Cross-Domain Imitation Learning with Visual Observations

Anti-Forgetting Adaptation for Unsupervised Person Re-identification

Image Embedding Sampling Method for Diverse Captioning

Compress image to patches for Vision Transformer

最近の投稿

最近のコメント

アーカイブ

カテゴリー