-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Can Robots ‘Taste’ Grapes? Estimating SSC with Simple RGB Sensors
要約 生食用ブドウ栽培では、収穫は果実の品質を正確に評価することにかかっています … 続きを読む
VMix: Improving Text-to-Image Diffusion Model with Cross-Attention Mixing Control
要約 拡散モデルは、テキストから画像への生成において並外れた才能を発揮しますが、 … 続きを読む
カテゴリー: cs.CV
VMix: Improving Text-to-Image Diffusion Model with Cross-Attention Mixing Control はコメントを受け付けていません
Generalize Your Face Forgery Detectors: An Insertable Adaptation Module Is All You Need
要約 顔ディープフェイクのリスクに対処するために、顔偽造検出器が多数存在します。 … 続きを読む
カテゴリー: cs.CV
Generalize Your Face Forgery Detectors: An Insertable Adaptation Module Is All You Need はコメントを受け付けていません
Frequency-aware Event Cloud Network
要約 イベント カメラは、生物学にヒントを得たセンサーであり、驚異的な時間分解能 … 続きを読む
カテゴリー: cs.CV
Frequency-aware Event Cloud Network はコメントを受け付けていません
Two Heads Are Better Than One: Averaging along Fine-Tuning to Improve Targeted Transferability
要約 最適化にかかる時間は非標的型攻撃よりもはるかに長いにもかかわらず、標的型攻 … 続きを読む
DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT
要約 自然言語処理における GPT シリーズなどの自己回帰 (AR) 生成モデル … 続きを読む
カテゴリー: cs.CV
DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT はコメントを受け付けていません
Length-Aware DETR for Robust Moment Retrieval
要約 ビデオ モーメント検索 (MR) は、特定の自然言語クエリに基づいてビデオ … 続きを読む
TextMatch: Enhancing Image-Text Consistency Through Multimodal Optimization
要約 テキストから画像への生成モデルは、テキストから画像を作成することに優れてい … 続きを読む
Fine-Tuning TransMorph with Gradient Correlation for Anatomical Alignment
要約 教師なしディープラーニングは、解剖学的に正確な変換を達成しながら、解剖学的 … 続きを読む
A Simple Recipe for Contrastively Pre-training Video-First Encoders Beyond 16 Frames
要約 現実世界の長いビデオを理解するには、広範囲にわたる視覚的な依存関係のモデリ … 続きを読む