cs.CV」カテゴリーアーカイブ

Equivariant spatio-hemispherical networks for diffusion MRI deconvolution

要約 拡散 MRI (dMRI) 画像内の各ボクセルには、脳内の水の拡散の方向と … 続きを読む

カテゴリー: cs.CV, eess.IV | Equivariant spatio-hemispherical networks for diffusion MRI deconvolution はコメントを受け付けていません

LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection

要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection はコメントを受け付けていません

RoboGSim: A Real2Sim2Real Robotic Gaussian Splatting Simulator

要約 実世界の具体化されたデータを効率的に取得することがますます重要になっていま … 続きを読む

カテゴリー: cs.CV, cs.RO | RoboGSim: A Real2Sim2Real Robotic Gaussian Splatting Simulator はコメントを受け付けていません

Generative World Explorer

要約 部分的な観察を伴う計画は、身体化 AI における中心的な課題です。 これま … 続きを読む

カテゴリー: cs.CV | Generative World Explorer はコメントを受け付けていません

UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction

要約 正確な手のモーション キャプチャと標準化された 3D 表現は、手に関連する … 続きを読む

カテゴリー: cs.CV, cs.HC | UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction はコメントを受け付けていません

Partial Scene Text Retrieval

要約 部分シーン テキスト取得のタスクには、画像ギャラリーからの特定のクエリ テ … 続きを読む

カテゴリー: cs.CV | Partial Scene Text Retrieval はコメントを受け付けていません

Explanation for Trajectory Planning using Multi-modal Large Language Model for Autonomous Driving

要約 最近、エンドツーエンド型の自動運転モデル​​が開発されています。 これらの … 続きを読む

カテゴリー: cs.CV, cs.RO | Explanation for Trajectory Planning using Multi-modal Large Language Model for Autonomous Driving はコメントを受け付けていません

How Does Vision-Language Adaptation Impact the Safety of Vision Language Models?

要約 視覚言語適応 (VL 適応) は、マルチモーダル タスク向けに大規模言語モ … 続きを読む

カテゴリー: cs.CL, cs.CV | How Does Vision-Language Adaptation Impact the Safety of Vision Language Models? はコメントを受け付けていません

JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging

要約 大規模言語モデル (LLM) の急速な進歩に伴い、基礎モデル (FM) も … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.NE | JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging はコメントを受け付けていません

MANTIS: Interleaved Multi-Image Instruction Tuning

要約 大規模マルチモーダル モデル (LMM) は、単一画像ビジョン言語タスクで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MANTIS: Interleaved Multi-Image Instruction Tuning はコメントを受け付けていません