-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Efficient Leaf Disease Classification and Segmentation using Midpoint Normalization Technique and Attention Mechanism
要約 葉の画像からの植物疾患の検出の強化は、標識データが不足していることと複雑な … 続きを読む
efunc: An Efficient Function Representation without Neural Networks
要約 関数フィッティング/近似は、コンピューターグラフィックスおよびその他のエン … 続きを読む
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on
要約 Video Virtual Try-On(VVT)は、連続したビデオフレー … 続きを読む
カテゴリー: cs.CV
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on はコメントを受け付けていません
MME-Reasoning: A Comprehensive Benchmark for Logical Reasoning in MLLMs
要約 論理的推論は、人間の知性の基本的な側面であり、マルチモーダル大手言語モデル … 続きを読む
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation
要約 スーパー解像度(SR)の拡散モデルは、高品質の視覚的結果を生成しますが、高 … 続きを読む
カテゴリー: cs.CV
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation はコメントを受け付けていません
MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios
要約 マルチモーダル大手言語モデル(MLLM)は、静的画像から光学文字認識(OC … 続きを読む
カテゴリー: cs.CV
MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios はコメントを受け付けていません
HoliTom: Holistic Token Merging for Fast Video Large Language Models
要約 ビデオ大規模な言語モデル(ビデオLLM)はビデオ理解に優れていますが、冗長 … 続きを読む
カテゴリー: cs.CV
HoliTom: Holistic Token Merging for Fast Video Large Language Models はコメントを受け付けていません
Structure from Collision
要約 ニューラル放射輝度フィールド(NERF)や3Dガウススプラッティング(3D … 続きを読む
Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift
要約 テキストから画像への拡散モデルを使用したパーソナライズには、少数の画像例を … 続きを読む
カテゴリー: cs.CV
Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift はコメントを受け付けていません
Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning
要約 類似性は、特に重要なセマンティックな類似性を含むさまざまな形で現れ、例えば … 続きを読む
カテゴリー: cs.CV
Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning はコメントを受け付けていません