cs.CV」カテゴリーアーカイブ

Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation

要約 本研究では、シーンテキストをソース言語(例えばヒンディー語)からターゲット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation はコメントを受け付けていません

Mamba3D: Enhancing Local Features for 3D Point Cloud Analysis via State Space Model

要約 点群解析のための既存のTransformerベースのモデルは、2次関数的な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Mamba3D: Enhancing Local Features for 3D Point Cloud Analysis via State Space Model はコメントを受け付けていません

SABER-6D: Shape Representation Based Implicit Object Pose Estimation

要約 本論文では、与えられたポーズにおける形状表現を学習することで、埋め込み空間 … 続きを読む

カテゴリー: cs.CV | SABER-6D: Shape Representation Based Implicit Object Pose Estimation はコメントを受け付けていません

An open dataset for oracle bone script recognition and decipherment

要約 殷王朝の人文学や地理学を研究する学者にとって、3000年前に遡る古代中国の … 続きを読む

カテゴリー: cs.CV | An open dataset for oracle bone script recognition and decipherment はコメントを受け付けていません

GUing: A Mobile GUI Search Engine using a Vision-Language Model

要約 アプリ開発者は、他のアプリのグラフィカル・ユーザー・インターフェース(GU … 続きを読む

カテゴリー: cs.CV, cs.SE | GUing: A Mobile GUI Search Engine using a Vision-Language Model はコメントを受け付けていません

Implicit Concept Removal of Diffusion Models

要約 テキストから画像への拡散(T2I)モデルは、しばしば、透かしや安全でない画 … 続きを読む

カテゴリー: cs.CV | Implicit Concept Removal of Diffusion Models はコメントを受け付けていません

Does Data-Efficient Generalization Exacerbate Bias in Foundation Models?

要約 ファウンデーションモデルは、様々な領域においてラベル効率に優れたロバストモ … 続きを読む

カテゴリー: cs.CV, cs.LG | Does Data-Efficient Generalization Exacerbate Bias in Foundation Models? はコメントを受け付けていません

Privacy-Aware Document Visual Question Answering

要約 文書視覚的質問応答(DocVQA)は、急速に文書理解の中心的タスクに成長し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Privacy-Aware Document Visual Question Answering はコメントを受け付けていません

TRAM: Global Trajectory and Motion of 3D Humans from in-the-wild Videos

要約 我々はTRAMを提案する。TRAMはSLAMをロバスト化し、動きのある人間 … 続きを読む

カテゴリー: cs.CV | TRAM: Global Trajectory and Motion of 3D Humans from in-the-wild Videos はコメントを受け付けていません

Multi-Visual-Inertial System: Analysis, Calibration and Estimation

要約 本論文では、マルチ視覚慣性システム(MVIS)の状態推定を研究し、任意の数 … 続きを読む

カテゴリー: cs.CV, cs.RO | Multi-Visual-Inertial System: Analysis, Calibration and Estimation はコメントを受け付けていません