- 
最近の投稿- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
 
- 
最近のコメント表示できるコメントはありません。
- cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830) 
「cs.CV」カテゴリーアーカイブ
Hierarchical Image Matching for UAV Absolute Visual Localization via Semantic and Structural Constraints
要約 グローバルな参照に関するエージェントの位置を決定することを目的とする絶対的 … 続きを読む
LLM2TEA: Agentic AI Designer Finds Innovative Objects with Generative Evolutionary Multitasking
要約 このホワイトペーパーでは、複数のドメインからのデザインのデザインの相乗効果 … 続きを読む
ComfyUI-R1: Exploring Reasoning Models for Workflow Generation
要約 AIが生成したコンテンツは、モノリシックモデルからモジュラーワークフロー、 … 続きを読む
One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image
要約 マルチモーダル検索拡張生成(M-RAG)は、事実知識ベース(KB)を使用し … 続きを読む
Using Shapley interactions to understand how models use structure
要約 言語は複雑に構造化されたシステムであり、NLP解釈可能性の重要な目標は、言 … 続きを読む
MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion
要約 微小発現(ME)は、個人の真の感情的状態を明らかにする微妙でつかの間の非言 … 続きを読む
									
						カテゴリー: cs.CV					
					
				
				
				MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion はコメントを受け付けていません
							
		DynaSplat: Dynamic-Static Gaussian Splatting with Hierarchical Motion Decomposition for Scene Reconstruction
要約 複雑で絶えず変化する環境を再構築することは、コンピュータービジョンの中心的 … 続きを読む
OctoNav: Towards Generalist Embodied Navigation
要約 具体化されたナビゲーションは、具体化されたAIのより広範な追求内の基礎柱と … 続きを読む
Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition
要約 手書きのテキスト認識は、視覚入力を機械可読テキストに変換することを目的とし … 続きを読む
