-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
MME-Reasoning: A Comprehensive Benchmark for Logical Reasoning in MLLMs
要約 論理的推論は、人間の知性の基本的な側面であり、マルチモーダル大手言語モデル … 続きを読む
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation
要約 スーパー解像度(SR)の拡散モデルは、高品質の視覚的結果を生成しますが、高 … 続きを読む
カテゴリー: cs.CV
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation はコメントを受け付けていません
MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios
要約 マルチモーダル大手言語モデル(MLLM)は、静的画像から光学文字認識(OC … 続きを読む
カテゴリー: cs.CV
MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios はコメントを受け付けていません
HoliTom: Holistic Token Merging for Fast Video Large Language Models
要約 ビデオ大規模な言語モデル(ビデオLLM)はビデオ理解に優れていますが、冗長 … 続きを読む
カテゴリー: cs.CV
HoliTom: Holistic Token Merging for Fast Video Large Language Models はコメントを受け付けていません
Structure from Collision
要約 ニューラル放射輝度フィールド(NERF)や3Dガウススプラッティング(3D … 続きを読む
Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift
要約 テキストから画像への拡散モデルを使用したパーソナライズには、少数の画像例を … 続きを読む
カテゴリー: cs.CV
Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift はコメントを受け付けていません
Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning
要約 類似性は、特に重要なセマンティックな類似性を含むさまざまな形で現れ、例えば … 続きを読む
カテゴリー: cs.CV
Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning はコメントを受け付けていません
Cognitive Disentanglement for Referring Multi-Object Tracking
要約 インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む
カテゴリー: cs.CV
Cognitive Disentanglement for Referring Multi-Object Tracking はコメントを受け付けていません
Prostate Cancer Screening with Artificial Intelligence-Enhanced Micro-Ultrasound: A Comparative Study with Traditional Methods
要約 背景と目的:Micro-Ultrasound(Micro-US)は、臨床的 … 続きを読む
AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping
要約 正確な作物マッピングは、個々のフィールドテクスチャから景観レベルのコンテキ … 続きを読む