- 
最近の投稿- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
 
- 
最近のコメント表示できるコメントはありません。
- cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830) 
「cs.CV」カテゴリーアーカイブ
PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework
要約 美的ポスターを生成することは、シンプルなデザイン画像よりも困難です。正確な … 続きを読む
									
						カテゴリー: cs.CV					
					
				
				
				PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework はコメントを受け付けていません
							
		Stroke-based Cyclic Amplifier: Image Super-Resolution at Arbitrary Ultra-Large Scales
要約 以前の任意のスケール画像スーパー解像度(ASISR)メソッドは、アップサン … 続きを読む
SlotPi: Physics-informed Object-centric Reasoning Models
要約 現実世界の人間の能力に似た視覚的観察を通じて、物理的法則によって支配される … 続きを読む
Human-Robot Navigation using Event-based Cameras and Reinforcement Learning
要約 この作業では、イベントカメラとその他のセンサーを補強学習と組み合わせて、リ … 続きを読む
									
						カテゴリー: cs.CV					
					
				
				
				Human-Robot Navigation using Event-based Cameras and Reinforcement Learning はコメントを受け付けていません
							
		Modality-AGnostic Image Cascade (MAGIC) for Multi-Modality Cardiac Substructure Segmentation
要約 心臓の下部構造は、放射線誘発性心疾患のリスクを最小限に抑えるために胸部放射 … 続きを読む
									
						カテゴリー: cs.CV, physics.med-ph					
					
				
				
				Modality-AGnostic Image Cascade (MAGIC) for Multi-Modality Cardiac Substructure Segmentation はコメントを受け付けていません
							
		Prompts to Summaries: Zero-Shot Language-Guided Video Summarization
要約 ビデオデータの爆発的な成長により、ドメイン固有のトレーニングデータなしで動 … 続きを読む
									
						カテゴリー: cs.CV					
					
				
				
				Prompts to Summaries: Zero-Shot Language-Guided Video Summarization はコメントを受け付けていません
							
		Unsupervised Deformable Image Registration with Structural Nonparametric Smoothing
要約 学習ベースの変形可能な画像登録(DIR)は、ニューラルネットワークを介した … 続きを読む
Occlusion-Aware 3D Hand-Object Pose Estimation with Masked AutoEncoders
要約 単眼のRGB画像からのハンドオブジェクトのポーズ推定は、主に手観書の相互作 … 続きを読む
									
						カテゴリー: cs.CV					
					
				
				
				Occlusion-Aware 3D Hand-Object Pose Estimation with Masked AutoEncoders はコメントを受け付けていません
							
		VideoDeepResearch: Long Video Understanding With Agentic Tool Using
要約 長いビデオ理解(LVU)は、タスクに固有の複雑さとコンテキストウィンドウの … 続きを読む
Generalist Models in Medical Image Segmentation: A Survey and Performance Comparison with Task-Specific Approaches
要約 大規模な言語モデルのパラダイムシフトが成功し、データの大規模なコーパスでの … 続きを読む
