-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Balancing Accuracy, Calibration, and Efficiency in Active Learning with Vision Transformers Under Label Noise
要約 下流タスクのImagenet上の事前に訓練された畳み込みニューラルネットワ … 続きを読む
mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition
要約 Audio-Visuual Speech Speech Septureat … 続きを読む
Geometry-Aware Texture Generation for 3D Head Modeling with Artist-driven Control
要約 正確な芸術的ビジョンに一致する仮想キャラクターのための現実的な3Dヘッド資 … 続きを読む
Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle
要約 前の車両の視覚的追跡により、路面の異常を検出するための新しいアプローチが提 … 続きを読む
カテゴリー: cs.CV
Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle はコメントを受け付けていません
SwinLip: An Efficient Visual Speech Encoder for Lip Reading Using Swin Transformer
要約 このペーパーでは、リップリーディング用の効率的な視覚音声エンコーダーを紹介 … 続きを読む
Deep residual learning with product units
要約 製品ユニットを残留ブロックに統合して、深い畳み込みネットワークの表現力とパ … 続きを読む
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities
要約 近年、マルチモーダル理解モデルと画像生成モデルの両方で顕著な進歩が見られて … 続きを読む
カテゴリー: cs.CV
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities はコメントを受け付けていません
MFSeg: Efficient Multi-frame 3D Semantic Segmentation
要約 効率的なマルチフレーム3Dセマンティックセグメンテーションフレームワークで … 続きを読む
カテゴリー: cs.CV
MFSeg: Efficient Multi-frame 3D Semantic Segmentation はコメントを受け付けていません
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception
要約 高密度の視覚的予測タスクは、事前定義されたカテゴリへの依存によって制約され … 続きを読む
カテゴリー: cs.CV
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception はコメントを受け付けていません
RLMiniStyler: Light-weight RL Style Agent for Arbitrary Sequential Neural Style Generation
要約 任意のスタイル転送は、特定の芸術的画像のスタイルを別のコンテンツ画像に適用 … 続きを読む
カテゴリー: cs.CV
RLMiniStyler: Light-weight RL Style Agent for Arbitrary Sequential Neural Style Generation はコメントを受け付けていません