-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models
要約 生成モデルの急速な進歩に伴い、AIが生成する画像のリアリズムは著しく向上し … 続きを読む
カテゴリー: cs.CV
DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models はコメントを受け付けていません
Smartflow: Enabling Scalable Spatiotemporal Geospatial Research
要約 BlackSkyは、オープンソースのツールやテクノロジーをベースに構築され … 続きを読む
We Should Chart an Atlas of All the World’s Models
要約 公開モデルリポジトリには、現在数百万ものモデルが含まれていますが、ほとんど … 続きを読む
Adversarial Robustness of AI-Generated Image Detectors in the Real World
要約 ジェネレーティブ・アーティフィシャル・インテリジェンス(GenAI)機能の … 続きを読む
Sparse-vDiT: Unleashing the Power of Sparse Attention to Accelerate Video Diffusion Transformers
要約 拡散変換(DiT)はビデオ生成において画期的な進歩を遂げたが、この長いシー … 続きを読む
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining
要約 実世界の3Dシーンを包括的に理解するためには、任意の、あるいは以前に見たこ … 続きを読む
カテゴリー: cs.CV
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining はコメントを受け付けていません
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data
要約 本論文では、大規模なラベル付きデータセットへの依存を低減する一方で、ソース … 続きを読む
カテゴリー: cs.CV
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data はコメントを受け付けていません
EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models
要約 テキストから画像への生成モデル~(Stable Diffusionなど)は … 続きを読む
カテゴリー: cs.CV
EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models はコメントを受け付けていません
SASP: Strip-Aware Spatial Perception for Fine-Grained Bird Image Classification
要約 きめ細かな鳥類画像分類(FBIC)は、生態学的モニタリングや種の同定に大き … 続きを読む
LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM
要約 最新のガウス散布法は、3Dシーンのリアルタイムフォトリアリスティックレンダ … 続きを読む
カテゴリー: cs.CV
LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM はコメントを受け付けていません