-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Automated Measurement of Eczema Severity with Self-Supervised Learning
要約 デジタルカメラから取得した画像を使用した湿疹の自動診断により、個人は回復を … 続きを読む
Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning
要約 MILS(Multimodal Iterative LLM Solver) … 続きを読む
DreamDistribution: Learning Prompt Distribution for Diverse In-distribution Generation
要約 テキストからイメージ(T2I)拡散モデルの普及により、テキストの説明から高 … 続きを読む
カテゴリー: cs.CV
DreamDistribution: Learning Prompt Distribution for Diverse In-distribution Generation はコメントを受け付けていません
Shape-Guided Clothing Warping for Virtual Try-On
要約 画像ベースのVirtual Try-Onは、ポーズの一貫性を維持しながら、 … 続きを読む
カテゴリー: cs.CV
Shape-Guided Clothing Warping for Virtual Try-On はコメントを受け付けていません
SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam
要約 生態学的健康と保全の取り組みにとって、水生生物多様性の理解と監視が重要です … 続きを読む
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
要約 デジタルモデリングと人間の顔の再構築は、さまざまなアプリケーションに役立ち … 続きを読む
Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields
要約 弱い重力レンズは、主に宇宙の暗黒物質の重力効果によって引き起こされる銀河形 … 続きを読む
カテゴリー: astro-ph.CO, cs.CV
Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields はコメントを受け付けていません
Diffusion Bridge Models for 3D Medical Image Translation
要約 拡散テンソルイメージング(DTI)は、人間の脳の微細構造に関する重要な洞察 … 続きを読む
カテゴリー: cs.CV
Diffusion Bridge Models for 3D Medical Image Translation はコメントを受け付けていません
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
要約 大規模なマルチモーダルモデル(LMM)は、ビデオフレームを均一に知覚し、本 … 続きを読む
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models
要約 長いコンテキストマルチモーダル学習のために、フロンティアビジョンモデル(V … 続きを読む
カテゴリー: cs.CV
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models はコメントを受け付けていません