-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments
要約 視覚障害者またはロービジョン (BLV) のある人が、自分が撮った写真を共 … 続きを読む
カテゴリー: cs.CV
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments はコメントを受け付けていません
FaceMe: Robust Blind Face Restoration with Personal Identification
要約 ブラインドフェイスの復元は、必要なコンテキストが欠如しているため、非常に不 … 続きを読む
カテゴリー: cs.CV
FaceMe: Robust Blind Face Restoration with Personal Identification はコメントを受け付けていません
Self-supervised video pretraining yields robust and more human-aligned visual representations
要約 人間は、時間の経過とともにそれらがどのように進化するかを観察することによっ … 続きを読む
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion
要約 トレーニング中にペアの合成シーン画像を必要としない、効果的なゼロショット … 続きを読む
カテゴリー: cs.CV
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion はコメントを受け付けていません
Improving Medical Visual Representations via Radiology Report Generation
要約 ビジョン言語の事前トレーニングは、下流のコンピューター ビジョン タスクに … 続きを読む
カテゴリー: cs.CV
Improving Medical Visual Representations via Radiology Report Generation はコメントを受け付けていません
Self-Supervised Masked Mesh Learning for Unsupervised Anomaly Detection on 3D Cortical Surfaces
要約 脳画像処理における教師なし異常検出は困難です。 この論文では、3D 皮質表 … 続きを読む
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models
要約 拡散モデルは、高品質の画像合成のための強力な生成モデルとして登場し、その後 … 続きを読む
カテゴリー: cs.CV
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models はコメントを受け付けていません
Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey
要約 マルチモーダル ビジョン ランゲージ モデル (VLM) は、コンピュータ … 続きを読む
MS-Temba : Multi-Scale Temporal Mamba for Efficient Temporal Action Detection
要約 1 時間のトリミングされていないビデオではアクションが密に分散されているた … 続きを読む
カテゴリー: cs.CV
MS-Temba : Multi-Scale Temporal Mamba for Efficient Temporal Action Detection はコメントを受け付けていません
Two Stage Segmentation of Cervical Tumors using PocketNet
要約 子宮頸がんは、依然として世界中の女性の間で 4 番目に多い悪性腫瘍です。1 … 続きを読む