-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition
要約 継続的な手話認識(CSLR)は、ビデオの手話ジェスチャーの解釈と転写シーケ … 続きを読む
カテゴリー: cs.CV
CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition はコメントを受け付けていません
Overlap-Aware Feature Learning for Robust Unsupervised Domain Adaptation for 3D Semantic Segmentation
要約 3Dポイントクラウドセマンティックセグメンテーション(PCSS)は、ロボッ … 続きを読む
FriendNet: Detection-Friendly Dehazing Network
要約 有害な気象条件は、多くの場合、キャプチャされた画像の品質を損ない、必然的に … 続きを読む
カテゴリー: cs.CV
FriendNet: Detection-Friendly Dehazing Network はコメントを受け付けていません
InvFussion: Bridging Supervised and Zero-shot Diffusion for Inverse Problems
要約 拡散モデルは、逆の問題の処理において顕著な能力を示しており、高品質の後サン … 続きを読む
カテゴリー: cs.CV
InvFussion: Bridging Supervised and Zero-shot Diffusion for Inverse Problems はコメントを受け付けていません
Towards Physically Plausible Video Generation via VLM Planning
要約 ビデオ拡散モデル(VDMS)は近年大幅に進歩しており、非常に現実的なビデオ … 続きを読む
Why Autonomous Vehicles Are Not Ready Yet: A Multi-Disciplinary Review of Problems, Attempted Solutions, and Future Directions
要約 個人の自動運転車は、周囲の環境を感知し、ルートを計画し、人間のドライバーの … 続きを読む
DLFR-VAE: Dynamic Latent Frame Rate VAE for Video Generation
要約 この論文では、潜在空間で適応的な時間的圧縮を利用できるトレーニングなしのパ … 続きを読む
{GSR4B}: Biomass Map Super-Resolution with Sentinel-1/2 Guidance
要約 大規模および高空間的解像度の両方での正確な地上バイオマス(AGB)マッピン … 続きを読む
カテゴリー: cs.CV
{GSR4B}: Biomass Map Super-Resolution with Sentinel-1/2 Guidance はコメントを受け付けていません
CoMM: A Coherent Interleaved Image-Text Dataset for Multimodal Understanding and Generation
要約 インターリーブされた画像テキスト生成は、クエリを与えられたインターリーブ視 … 続きを読む
カテゴリー: cs.CV
CoMM: A Coherent Interleaved Image-Text Dataset for Multimodal Understanding and Generation はコメントを受け付けていません
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
要約 最近の画像ベースのヒューマンアニメーション方法は、現実的な身体と顔の動きの … 続きを読む