-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes
要約 特に意味的に類似したクラスが多数あるシナリオに対して、高速かつ正確な少数シ … 続きを読む
Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models
要約 敵対的な例を含む標的型転送ベースの攻撃は、大規模な視覚言語モデル (VLM … 続きを読む
カテゴリー: cs.CV
Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models はコメントを受け付けていません
Gait Recognition from Highly Compressed Videos
要約 監視映像は、歩行分析を実施するための貴重なリソースと機会を表します。 ただ … 続きを読む
カテゴリー: cs.CV
Gait Recognition from Highly Compressed Videos はコメントを受け付けていません
Aligning Actions and Walking to LLM-Generated Textual Descriptions
要約 大規模言語モデル (LLM) は、データ拡張や合成データ生成など、さまざま … 続きを読む
カテゴリー: cs.CV
Aligning Actions and Walking to LLM-Generated Textual Descriptions はコメントを受け付けていません
GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes
要約 顔画像品質評価 (FIQA) は、自動顔認識 (FR) システムにおける顔 … 続きを読む
カテゴリー: cs.CV
GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes はコメントを受け付けていません
Partial-to-Partial Shape Matching with Geometric Consistency
要約 3D 形状間の対応関係を見つけることは、コンピュータ ビジョン、グラフィッ … 続きを読む
カテゴリー: cs.CV
Partial-to-Partial Shape Matching with Geometric Consistency はコメントを受け付けていません
Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training
要約 コンピューター ビジョンにおける大規模ビジョン トランスフォーマー (Vi … 続きを読む
カテゴリー: cs.CV
Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training はコメントを受け付けていません
ProTA: Probabilistic Token Aggregation for Text-Video Retrieval
要約 テキストビデオ検索は、特定のクエリに対して最も関連性の高いクロスモーダル … 続きを読む
カテゴリー: cs.CV
ProTA: Probabilistic Token Aggregation for Text-Video Retrieval はコメントを受け付けていません
Beyond Average: Individualized Visual Scanpath Prediction
要約 注意力が個人によってどのように異なるかを理解することは、科学的および社会的 … 続きを読む
カテゴリー: cs.CV
Beyond Average: Individualized Visual Scanpath Prediction はコメントを受け付けていません
Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition
要約 私たちは、テンソル分解によるネットワーク圧縮の有効性を研究することで、高度 … 続きを読む