-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models
要約 ジェネレーティブAIの急速な発展は、コンテンツ作成を容易にするだけでなく、 … 続きを読む
Vinoground: Scrutinizing LMMs over Dense Temporal Reasoning with Short Videos
要約 最近、最新の大規模マルチモーダルモデル(LMM)は、短編ビデオの理解に関連 … 続きを読む
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks
要約 テキストリッチ画像は、テキストが全体的な理解を導く中心的な視覚要素として機 … 続きを読む
Fake It Until You Break It: On the Adversarial Robustness of AI-generated Image Detectors
要約 ジェネレーティブAI(GenAI)は創造的で生産的なタスクに無数の可能性を … 続きを読む
Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression
要約 何十年もの間、映像圧縮技術は著名な研究分野であった。従来のハイブリッド動画 … 続きを読む
MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning
要約 広範な研究により、ディープニューラルネットワーク(DNN)は、わずかな敵対 … 続きを読む
LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models
要約 眼科では、診断や治療計画のために詳細な画像解析に大きく依存している。大規模 … 続きを読む
カテゴリー: cs.CV
LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models はコメントを受け付けていません
OccRWKV: Rethinking Efficient 3D Semantic Occupancy Prediction with Linear Complexity
要約 3D セマンティック占有予測ネットワークは、3D シーンの幾何学的およびセ … 続きを読む
Improving Zero-Shot ObjectNav with Generative Communication
要約 我々は、潜在的に利用可能な環境認識をナビゲーション支援に利用することを目的 … 続きを読む
CANVAS: Commonsense-Aware Navigation System for Intuitive Human-Robot Interaction
要約 現実のロボットナビゲーションには、単に目的地に到達するだけではありません。 … 続きを読む