-
最近の投稿
- Agent-Based Emulation for Deploying Robot Swarm Behaviors
- Automated Planning Domain Inference for Task and Motion Planning
- Tactile Displays Driven by Projected Light
- Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception
- Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
-
最近のコメント
表示できるコメントはありません。 cs.AI (28464) cs.CL (21516) cs.CR (2224) cs.CV (35088) cs.LG (33220) cs.RO (16420) cs.SY (2528) eess.IV (4274) eess.SY (2522) stat.ML (4457)
月別アーカイブ: 2024年6月
Blind Image Deblurring using FFT-ReLU with Deep Learning Pipeline Integration
要約 ブラインド画像のブラー除去は、ぼやけた画像から鮮明な画像とブラー カーネル … 続きを読む
カテゴリー: cs.CV
Blind Image Deblurring using FFT-ReLU with Deep Learning Pipeline Integration はコメントを受け付けていません
DocSynthv2: A Practical Autoregressive Modeling for Document Generation
要約 ドキュメント レイアウトの生成は広く研究されていますが、レイアウトとコンテ … 続きを読む
From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition
要約 人々の社会的関係は、結婚指輪、バラ、ハグ、手をつなぐなど、特定の物体や相互 … 続きを読む
APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentatio
要約 フューショット セマンティック セグメンテーション (FSS) は、少数の … 続きを読む
カテゴリー: cs.CV
APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentatio はコメントを受け付けていません
2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction
要約 陽電子放出断層撮影法 (PET) は重要な臨床画像ツールですが、患者や医療 … 続きを読む
DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor
要約 事前トレーニングされたネットワークによって抽出された画像の詳細な特徴には、 … 続きを読む
カテゴリー: cs.CV
DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor はコメントを受け付けていません
Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze
要約 この論文では、スマートグラスにおけるユーザー支援を進化させるための重要なコ … 続きを読む
カテゴリー: cs.CV
Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze はコメントを受け付けていません
LaneCPP: Continuous 3D Lane Detection using Physical Priors
要約 単眼 3D 車線検出は、路面の検出と車線区分線の位置の特定というタスクで構 … 続きを読む
カテゴリー: cs.CV
LaneCPP: Continuous 3D Lane Detection using Physical Priors はコメントを受け付けていません
Descriptive Image Quality Assessment in the Wild
要約 ビジョン言語モデル (VLM) の急速な進歩に伴い、VLM ベースの画質評 … 続きを読む
カテゴリー: cs.CV
Descriptive Image Quality Assessment in the Wild はコメントを受け付けていません
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation
要約 最近、伝統的にプロのデザイナーの領域である芸術的なフォントを作成するための … 続きを読む
カテゴリー: cs.CV
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation はコメントを受け付けていません