-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Explainable AI-Enhanced Deep Learning for Pumpkin Leaf Disease Detection: A Comparative Analysis of CNN Architectures
要約 カボチャの葉の病気は、農業の生産性に対する重大な脅威であり、効果的な管理の … 続きを読む
カテゴリー: cs.CV
Explainable AI-Enhanced Deep Learning for Pumpkin Leaf Disease Detection: A Comparative Analysis of CNN Architectures はコメントを受け付けていません
Zero-Shot Low-dose CT Denoising via Sinogram Flicking
要約 多くの低用量のCTイメージング方法は、監視された学習に依存しており、これに … 続きを読む
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement
要約 この論文では、知識の蒸留なしで純粋に自己改善に依存して、トレーニングサンプ … 続きを読む
カテゴリー: cs.CV
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement はコメントを受け付けていません
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos
要約 360 {\ deg}ビデオは、ダイナミックな視覚世界を表す有望な媒体とし … 続きを読む
カテゴリー: cs.CV
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos はコメントを受け付けていません
MARS: a Multimodal Alignment and Ranking System for Few-Shot Segmentation
要約 現在の少数のショットセグメンテーションの文献には、クエリとサンプル画像の視 … 続きを読む
カテゴリー: cs.CV
MARS: a Multimodal Alignment and Ranking System for Few-Shot Segmentation はコメントを受け付けていません
HoloPart: Generative 3D Part Amodal Segmentation
要約 3D部品のアモーダルセグメンテーション – 3D形状を完全で意 … 続きを読む
カテゴリー: cs.CV
HoloPart: Generative 3D Part Amodal Segmentation はコメントを受け付けていません
GenEAva: Generating Cartoon Avatars with Fine-Grained Facial Expressions from Realistic Diffusion-based Faces
要約 漫画のアバターは、ソーシャルメディア、オンラインチューター、ゲームなど、さ … 続きを読む
Taming Data and Transformers for Scalable Audio Generation
要約 アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む
InteractAvatar: Modeling Hand-Face Interaction in Photorealistic Avatars with Deformable Gaussians
要約 デジタルアバターのコミュニティからの関心が高まっているため、コミュニケーシ … 続きを読む
カテゴリー: cs.CV
InteractAvatar: Modeling Hand-Face Interaction in Photorealistic Avatars with Deformable Gaussians はコメントを受け付けていません
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models
要約 マルチモーダル信号を通じて世界を効果的に知覚できる汎用モデルの構築は、長年 … 続きを読む
カテゴリー: cs.CV
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models はコメントを受け付けていません