月別アーカイブ: 2024年4月

When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes

投稿日: 2024年4月19日作成者: jarxiv

要約特に意味的に類似したクラスが多数あるシナリオに対して、高速かつ正確な少数シ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models

投稿日: 2024年4月19日作成者: jarxiv

要約敵対的な例を含む標的型転送ベースの攻撃は、大規模な視覚言語モデル (VLM … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gait Recognition from Highly Compressed Videos

投稿日: 2024年4月19日作成者: jarxiv

要約監視映像は、歩行分析を実施するための貴重なリソースと機会を表します。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Aligning Actions and Walking to LLM-Generated Textual Descriptions

投稿日: 2024年4月19日作成者: jarxiv

要約大規模言語モデル (LLM) は、データ拡張や合成データ生成など、さまざま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes

投稿日: 2024年4月19日作成者: jarxiv

要約顔画像品質評価 (FIQA) は、自動顔認識 (FR) システムにおける顔 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Partial-to-Partial Shape Matching with Geometric Consistency

投稿日: 2024年4月19日作成者: jarxiv

要約 3D 形状間の対応関係を見つけることは、コンピュータビジョン、グラフィッ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training

投稿日: 2024年4月19日作成者: jarxiv

要約コンピュータービジョンにおける大規模ビジョントランスフォーマー (Vi … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ProTA: Probabilistic Token Aggregation for Text-Video Retrieval

投稿日: 2024年4月19日作成者: jarxiv

要約テキストビデオ検索は、特定のクエリに対して最も関連性の高いクロスモーダル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Average: Individualized Visual Scanpath Prediction

投稿日: 2024年4月19日作成者: jarxiv

要約注意力が個人によってどのように異なるかを理解することは、科学的および社会的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition

投稿日: 2024年4月19日作成者: jarxiv

要約私たちは、テンソル分解によるネットワーク圧縮の有効性を研究することで、高度 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

月別アーカイブ: 2024年4月

When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes

Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models

Gait Recognition from Highly Compressed Videos

Aligning Actions and Walking to LLM-Generated Textual Descriptions

GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes

Partial-to-Partial Shape Matching with Geometric Consistency

Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training

ProTA: Probabilistic Token Aggregation for Text-Video Retrieval

Beyond Average: Individualized Visual Scanpath Prediction

Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition

最近の投稿

最近のコメント

アーカイブ

カテゴリー