-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing
要約 拡散モデルを用いたテキスト映像(T2V)生成における最近の進歩は、大きな注 … 続きを読む
Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control
要約 本研究では、ロバストな異常検出手法である反復的精密化プロセス(IRP)を紹 … 続きを読む
FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation
要約 レシピデータを用いた食品イメージの理解に関する研究は、そのデータの多様性と … 続きを読む
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts
要約 既存のスコアディスティレーションサンプリング(SDS)ベースの手法は、テキ … 続きを読む
カテゴリー: cs.CV
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts はコメントを受け付けていません
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition
要約 捕獲された行動は個体群の健康状態の変化を示す最も早い指標となるため、カメラ … 続きを読む
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models
要約 物体中心(OC)表現は、視覚シーンを離散的な物体の構成としてモデル化するも … 続きを読む
Foundation Models — A Panacea for Artificial Intelligence in Pathology?
要約 病理診断における人工知能(AI)の役割は、診断の補助から、全スライド画像( … 続きを読む
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing
要約 拡散に基づく画像生成は大きく進歩したが、被写体駆動型生成と指示に基づく編集 … 続きを読む
カテゴリー: cs.CV
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing はコメントを受け付けていません
FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering
要約 ドライビングシーンの再構成とレンダリングは、3Dガウススプラッティングを用 … 続きを読む
カテゴリー: cs.CV
FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering はコメントを受け付けていません
Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning
要約 多インスタンス学習(Multi-Instance Learning: MI … 続きを読む
カテゴリー: cs.CV
Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning はコメントを受け付けていません