-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Visual Intention Grounding for Egocentric Assistants
要約 Visual Groundingは、テキストの説明を画像内のオブジェクトと … 続きを読む
カテゴリー: cs.CV
Visual Intention Grounding for Egocentric Assistants はコメントを受け付けていません
SupResDiffGAN a new approach for the Super-Resolution task
要約 この作業では、超解像度タスクの生成的敵対ネットワーク(GANS)と拡散モデ … 続きを読む
DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection
要約 視覚変圧器(VIT)は、グローバルな特徴を抽出する特別な能力により、合成開 … 続きを読む
カテゴリー: cs.CV
DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection はコメントを受け付けていません
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis
要約 異常合成は、異常検査を進めるための異常なデータを増強するための重要なアプロ … 続きを読む
The Mirage of Performance Gains: Why Contrastive Decoding Fails to Address Multimodal Hallucination
要約 対照的なデコード戦略は、マルチモーダルの大手言語モデル(MLLM)の幻覚を … 続きを読む
IReNe: Instant Recoloring of Neural Radiance Fields
要約 NERFの進歩により、3Dシーンの再構築と新しいビューの合成が可能になりま … 続きを読む
カテゴリー: cs.CV
IReNe: Instant Recoloring of Neural Radiance Fields はコメントを受け付けていません
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations
要約 対照的なインスタンス識別方法は、画像分類やオブジェクト検出などの下流タ … 続きを読む
カテゴリー: cs.CV
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations はコメントを受け付けていません
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation
要約 テキストからイメージ(T2I)生成モデルは、近年大幅に進歩しています。 た … 続きを読む
カテゴリー: cs.CV
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation はコメントを受け付けていません
Efficient Parameter Adaptation for Multi-Modal Medical Image Segmentation and Prognosis
要約 がんの検出と予後は、医療イメージング、特にCTとPETスキャンに大きく依存 … 続きを読む
Lightweight LiDAR-Camera 3D Dynamic Object Detection and Multi-Class Trajectory Prediction
要約 多くの場合、サービスモバイルロボットは、タスクを実行しながら動的なオブジェ … 続きを読む