月別アーカイブ: 2024年4月

When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes

要約 特に意味的に類似したクラスが多数あるシナリオに対して、高速かつ正確な少数シ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes はコメントを受け付けていません

Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models

要約 敵対的な例を含む標的型転送ベースの攻撃は、大規模な視覚言語モデル (VLM … 続きを読む

カテゴリー: cs.CV | Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models はコメントを受け付けていません

Gait Recognition from Highly Compressed Videos

要約 監視映像は、歩行分析を実施するための貴重なリソースと機会を表します。 ただ … 続きを読む

カテゴリー: cs.CV | Gait Recognition from Highly Compressed Videos はコメントを受け付けていません

Aligning Actions and Walking to LLM-Generated Textual Descriptions

要約 大規模言語モデル (LLM) は、データ拡張や合成データ生成など、さまざま … 続きを読む

カテゴリー: cs.CV | Aligning Actions and Walking to LLM-Generated Textual Descriptions はコメントを受け付けていません

GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes

要約 顔画像品質評価 (FIQA) は、自動顔認識 (FR) システムにおける顔 … 続きを読む

カテゴリー: cs.CV | GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes はコメントを受け付けていません

Partial-to-Partial Shape Matching with Geometric Consistency

要約 3D 形状間の対応関係を見つけることは、コンピュータ ビジョン、グラフィッ … 続きを読む

カテゴリー: cs.CV | Partial-to-Partial Shape Matching with Geometric Consistency はコメントを受け付けていません

Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training

要約 コンピューター ビジョンにおける大規模ビジョン トランスフォーマー (Vi … 続きを読む

カテゴリー: cs.CV | Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training はコメントを受け付けていません

ProTA: Probabilistic Token Aggregation for Text-Video Retrieval

要約 テキストビデオ検索は、特定のクエリに対して最も関連性の高いクロスモーダル … 続きを読む

カテゴリー: cs.CV | ProTA: Probabilistic Token Aggregation for Text-Video Retrieval はコメントを受け付けていません

Beyond Average: Individualized Visual Scanpath Prediction

要約 注意力が個人によってどのように異なるかを理解することは、科学的および社会的 … 続きを読む

カテゴリー: cs.CV | Beyond Average: Individualized Visual Scanpath Prediction はコメントを受け付けていません

Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition

要約 私たちは、テンソル分解によるネットワーク圧縮の有効性を研究することで、高度 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition はコメントを受け付けていません