-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics
要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む
Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation
要約 音声から画像への生成モデルをトレーニングするには、意味的に整合した多様な音 … 続きを読む
From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI
要約 脳腫瘍は医療診断における大きな課題であり、効果的な治療には正確かつタイムリ … 続きを読む
カテゴリー: cs.CV
From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI はコメントを受け付けていません
Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation
要約 2D 画像生成の最近の進歩は、主に拡散モデルの能力と大規模なデータセットの … 続きを読む
カテゴリー: cs.CV
Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation はコメントを受け付けていません
Flatland Vision
要約 一対の投影面にある 2 組のラベル付き点を投影線上の同じ画像に投影できるの … 続きを読む
AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning
要約 オンラインで入手可能な画像テキスト データの膨大なリポジトリを活用して、大 … 続きを読む
Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data
要約 パスワードに依存するセキュリティ システムは、忘れられたり、推測されたり、 … 続きを読む
$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation
要約 人間の脳の形状は複雑で非常に多様であり、脳の大きさ、皮質の折り畳み、年齢の … 続きを読む
カテゴリー: cs.CV
$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation はコメントを受け付けていません
The GAN is dead; long live the GAN! A Modern GAN Baseline
要約 GAN はトレーニングが難しいという主張が広く広まっており、文献中の GA … 続きを読む
Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces
要約 ビデオ トークナイザーは潜在ビデオ拡散モデルに不可欠であり、生のビデオ デ … 続きを読む