-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing
要約 リモートフォトプレチスモグラフィ(RPPG)は、非接触生理的測定を可能にし … 続きを読む
カテゴリー: cs.CV
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing はコメントを受け付けていません
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map
要約 コンピュータービジョン、特に産業用途向けの合成データセット生成は、依然とし … 続きを読む
カテゴリー: cs.CV
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map はコメントを受け付けていません
Cobra: Efficient Line Art COlorization with BRoAder References
要約 コミック生産業界では、高精度、効率、コンテキストの一貫性、柔軟な制御を備え … 続きを読む
カテゴリー: cs.CV
Cobra: Efficient Line Art COlorization with BRoAder References はコメントを受け付けていません
Rethinking Meta-Learning from a Learning Lens
要約 メタラーニングは、目に見えないタスクを解決するために、トレーニングタスクか … 続きを読む
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision
要約 ビデオ品質評価(VQA)は、カメラキャプチャシステムからオーバーザトップス … 続きを読む
カテゴリー: cs.CV
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision はコメントを受け付けていません
FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback
要約 大規模なビジョン言語モデル(LVLMS)は、さまざまな視覚言語タスクへの取 … 続きを読む
Towards Smart Point-and-Shoot Photography
要約 数億人がスマートフォンをPoint and Shoot(PAS)カメラとし … 続きを読む
カテゴリー: cs.CV
Towards Smart Point-and-Shoot Photography はコメントを受け付けていません
ALMA: Aggregated Lipschitz Maximization Attack on Auto-encoders
要約 重要なアプリケーションでのディープオートエンコーダー(AE)の広範な使用に … 続きを読む
Step1X-Edit: A Practical Framework for General Image Editing
要約 近年、画像編集モデルは驚くべき急速な発展を目撃しています。 GPT-4Oや … 続きを読む
カテゴリー: cs.CV
Step1X-Edit: A Practical Framework for General Image Editing はコメントを受け付けていません
ReGraP-LLaVA: Reasoning enabled Graph-based Personalized Large Language and Vision Assistant
要約 パーソナライズされたMLLMの最近の進歩により、ユーザー固有の概念を効果的 … 続きを読む