-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Hierarchical Image Matching for UAV Absolute Visual Localization via Semantic and Structural Constraints
要約 グローバルな参照に関するエージェントの位置を決定することを目的とする絶対的 … 続きを読む
LLM2TEA: Agentic AI Designer Finds Innovative Objects with Generative Evolutionary Multitasking
要約 このホワイトペーパーでは、複数のドメインからのデザインのデザインの相乗効果 … 続きを読む
ComfyUI-R1: Exploring Reasoning Models for Workflow Generation
要約 AIが生成したコンテンツは、モノリシックモデルからモジュラーワークフロー、 … 続きを読む
One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image
要約 マルチモーダル検索拡張生成(M-RAG)は、事実知識ベース(KB)を使用し … 続きを読む
Using Shapley interactions to understand how models use structure
要約 言語は複雑に構造化されたシステムであり、NLP解釈可能性の重要な目標は、言 … 続きを読む
MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion
要約 微小発現(ME)は、個人の真の感情的状態を明らかにする微妙でつかの間の非言 … 続きを読む
カテゴリー: cs.CV
MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion はコメントを受け付けていません
DynaSplat: Dynamic-Static Gaussian Splatting with Hierarchical Motion Decomposition for Scene Reconstruction
要約 複雑で絶えず変化する環境を再構築することは、コンピュータービジョンの中心的 … 続きを読む
OctoNav: Towards Generalist Embodied Navigation
要約 具体化されたナビゲーションは、具体化されたAIのより広範な追求内の基礎柱と … 続きを読む
Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition
要約 手書きのテキスト認識は、視覚入力を機械可読テキストに変換することを目的とし … 続きを読む