-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting
要約 安全な自律運転(AD)には、正確なモーション予測が重要です。 この研究では … 続きを読む
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations
要約 単一のRGBカメラからのオブジェクト3Dの位置と方向を推測することは、多く … 続きを読む
AI-Driven Automated Tool for Abdominal CT Body Composition Analysis in Gastrointestinal Cancer Management
要約 胃腸がんの発生率は、特に中国では、正確な予後評価と効果的な治療戦略の重要性 … 続きを読む
COMODO: Cross-Modal Video-to-IMU Distillation for Efficient Egocentric Human Activity Recognition
要約 エゴセントリックビデオベースのモデルは、豊富なセマンティック情報をキャプチ … 続きを読む
WISE: A World Knowledge-Informed Semantic Evaluation for Text-to-Image Generation
要約 テキストツーイメージ(T2I)モデルは、高品質の芸術作品と視覚的なコンテン … 続きを読む
Distilling Knowledge into Quantum Vision Transformers for Biomedical Image Classification
要約 量子視力変圧器(QVITS)は、自己触媒メカニズム内の線形層をパラメーター … 続きを読む
ALLVB: All-in-One Long Video Understanding Benchmark
要約 画像からビデオの理解まで、マルチモーダルLLMS(MLLM)の機能はますま … 続きを読む
カテゴリー: cs.CV
ALLVB: All-in-One Long Video Understanding Benchmark はコメントを受け付けていません
Goal Conditioned Reinforcement Learning for Photo Finishing Tuning
要約 写真仕上げのチューニングは、Adobe LightroomやDarktab … 続きを読む
AttenST: A Training-Free Attention-Driven Style Transfer Framework with Pre-Trained Diffusion Models
要約 拡散モデルはスタイル転送タスクで顕著な進歩を遂げましたが、既存の方法は通常 … 続きを読む
カテゴリー: cs.CV
AttenST: A Training-Free Attention-Driven Style Transfer Framework with Pre-Trained Diffusion Models はコメントを受け付けていません
BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis
要約 ビルボードスプラッティング(BBSPLAT) – テクスチャの … 続きを読む
カテゴリー: cs.CV
BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis はコメントを受け付けていません