「cs.CV」カテゴリーアーカイブ

Bio-inspired visual relative localization for large swarms of UAVs

投稿日: 2024年12月4日作成者: jarxiv

要約我々は、UAVの大規模群内のエージェントの相対的な定位のための視覚知覚の新 … 続きを読む →

カテゴリー: cs.CV, cs.RO, I.5.4 | コメントを受け付けていません

ScImage: How Good Are Multimodal Large Language Models at Scientific Text-to-Image Generation?

投稿日: 2024年12月4日作成者: jarxiv

要約マルチモーダル大規模言語モデル(LLM)は、テキスト指示から高品質な画像を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

BYE: Build Your Encoder with One Sequence of Exploration Data for Long-Term Dynamic Scene Understanding

投稿日: 2024年12月4日作成者: jarxiv

要約ロボットアプリケーションにおいて、動的なシーン理解は依然として根強い課題で … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations

投稿日: 2024年12月4日作成者: jarxiv

要約ディープラーニングの台頭により、顔認識技術は広範な研究と急速な発展を遂げて … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Multi-Class Abnormality Classification Task in Video Capsule Endoscopy

投稿日: 2024年12月4日作成者: jarxiv

要約 Capsule Vision Challenge 2024に向けた本研究で … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

RelayGS: Reconstructing Dynamic Scenes with Large-Scale and Complex Motions via Relay Gaussians

投稿日: 2024年12月4日作成者: jarxiv

要約大規模で複雑な動きを伴うダイナミックなシーンの再構築は、依然として大きな課 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection

投稿日: 2024年12月4日作成者: jarxiv

要約現在の半教師付き物体検出（Semi-Supervised Object D … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ROVER: A Multi-Season Dataset for Visual SLAM

投稿日: 2024年12月4日作成者: jarxiv

要約ロバストなSLAM（Simultaneous Localization a … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Towards Rich Emotions in 3D Avatars: A Text-to-3D Avatar Generation Benchmark

投稿日: 2024年12月4日作成者: jarxiv

要約話し言葉に由来するテキストを用いた感情的でダイナミックな3D顔アバター（E … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification

投稿日: 2024年12月4日作成者: jarxiv

要約マルチモーダル大規模言語モデル(MLLM)は、視覚理解、推論、インタラクシ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Bio-inspired visual relative localization for large swarms of UAVs

ScImage: How Good Are Multimodal Large Language Models at Scientific Text-to-Image Generation?

BYE: Build Your Encoder with One Sequence of Exploration Data for Long-Term Dynamic Scene Understanding

OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations

Multi-Class Abnormality Classification Task in Video Capsule Endoscopy

RelayGS: Reconstructing Dynamic Scenes with Large-Scale and Complex Motions via Relay Gaussians

Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection

ROVER: A Multi-Season Dataset for Visual SLAM

Towards Rich Emotions in 3D Avatars: A Text-to-3D Avatar Generation Benchmark

Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification

最近の投稿

最近のコメント

アーカイブ

カテゴリー