-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Evaluating alignment between humans and neural network representations in image-based learning tasks
要約 人間はシーンやオブジェクトを豊富な特徴空間で表現し、少数の例を使用してカテ … 続きを読む
VanGogh: A Unified Multimodal Diffusion-based Framework for Video Colorization
要約 ビデオのカラー化は、時間的な一貫性と構造的な完全性を維持しながら、グレース … 続きを読む
カテゴリー: cs.CV
VanGogh: A Unified Multimodal Diffusion-based Framework for Video Colorization はコメントを受け付けていません
Omni-Emotion: Extending Video MLLM with Detailed Face and Audio Modeling for Multimodal Emotion Analysis
要約 感情を正確に理解することは、人間とコンピューターのインタラクションなどの分 … 続きを読む
カテゴリー: cs.CV
Omni-Emotion: Extending Video MLLM with Detailed Face and Audio Modeling for Multimodal Emotion Analysis はコメントを受け付けていません
AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation
要約 最近、大規模な生成モデルは、優れたテキストから画像への生成機能を実証しまし … 続きを読む
カテゴリー: cs.CV
AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation はコメントを受け付けていません
HydraMix: Multi-Image Feature Mixing for Small Data Image Classification
要約 ディープ ニューラル ネットワークをトレーニングするには、多数の注釈付きサ … 続きを読む
カテゴリー: cs.CV
HydraMix: Multi-Image Feature Mixing for Small Data Image Classification はコメントを受け付けていません
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps
要約 顔認識技術はさまざまなアプリケーションでますます使用されていますが、顔のな … 続きを読む
AdaFV: Accelerating VLMs with Self-Adaptive Cross-Modality Attention Mixture
要約 VLM の成功は、多くの場合、入力画像を複数のクロップに適応的に拡張して画 … 続きを読む
カテゴリー: cs.CV
AdaFV: Accelerating VLMs with Self-Adaptive Cross-Modality Attention Mixture はコメントを受け付けていません
Enhancing Few-Shot Image Classification through Learnable Multi-Scale Embedding and Attention Mechanisms
要約 少数ショット分類のコンテキストでは、満足のいくパフォーマンスを維持しながら … 続きを読む
STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies
要約 時空間ネットワークの観察機能は、複数のセクターにわたる正確なデータ収集と情 … 続きを読む
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images
要約 医療画像の匿名化は、研究や臨床現場でデータを共有する際のプライバシーを確 … 続きを読む
カテゴリー: cs.CV
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images はコメントを受け付けていません