-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Equivariant spatio-hemispherical networks for diffusion MRI deconvolution
要約 拡散 MRI (dMRI) 画像内の各ボクセルには、脳内の水の拡散の方向と … 続きを読む
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection
要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む
RoboGSim: A Real2Sim2Real Robotic Gaussian Splatting Simulator
要約 実世界の具体化されたデータを効率的に取得することがますます重要になっていま … 続きを読む
Generative World Explorer
要約 部分的な観察を伴う計画は、身体化 AI における中心的な課題です。 これま … 続きを読む
カテゴリー: cs.CV
Generative World Explorer はコメントを受け付けていません
UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction
要約 正確な手のモーション キャプチャと標準化された 3D 表現は、手に関連する … 続きを読む
Partial Scene Text Retrieval
要約 部分シーン テキスト取得のタスクには、画像ギャラリーからの特定のクエリ テ … 続きを読む
カテゴリー: cs.CV
Partial Scene Text Retrieval はコメントを受け付けていません
Explanation for Trajectory Planning using Multi-modal Large Language Model for Autonomous Driving
要約 最近、エンドツーエンド型の自動運転モデルが開発されています。 これらの … 続きを読む
How Does Vision-Language Adaptation Impact the Safety of Vision Language Models?
要約 視覚言語適応 (VL 適応) は、マルチモーダル タスク向けに大規模言語モ … 続きを読む
JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging
要約 大規模言語モデル (LLM) の急速な進歩に伴い、基礎モデル (FM) も … 続きを読む
MANTIS: Interleaved Multi-Image Instruction Tuning
要約 大規模マルチモーダル モデル (LMM) は、単一画像ビジョン言語タスクで … 続きを読む