cs.CV」カテゴリーアーカイブ

Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos

要約 マルチビュー ビデオが与えられた場合、人間の観察者にとってどの視点が最も有 … 続きを読む

カテゴリー: cs.CV | Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos はコメントを受け付けていません

Weakly-Supervised Anomaly Detection in Surveillance Videos Based on Two-Stream I3D Convolution Network

要約 都市監視システムの広範な導入により、公共の安全を強化するために異常検出のた … 続きを読む

カテゴリー: cs.CV, cs.LG | Weakly-Supervised Anomaly Detection in Surveillance Videos Based on Two-Stream I3D Convolution Network はコメントを受け付けていません

Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation

要約 半教師あり学習と自己教師あり学習はラベルなしデータから知識を効果的にモデル … 続きを読む

カテゴリー: cs.CV | Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation はコメントを受け付けていません

HiFi-Syn: Hierarchical Granularity Discrimination for High-Fidelity Synthesis of MR Images with Structure Preservation

要約 医療画像の構造情報を保存しながら医療画像を合成することは、医学研究において … 続きを読む

カテゴリー: cs.CV, eess.IV | HiFi-Syn: Hierarchical Granularity Discrimination for High-Fidelity Synthesis of MR Images with Structure Preservation はコメントを受け付けていません

Sharingan: Extract User Action Sequence from Desktop Recordings

要約 ユーザー アクティビティのビデオ録画、特にデスクトップ録画は、ユーザーの行 … 続きを読む

カテゴリー: cs.AI, cs.CV | Sharingan: Extract User Action Sequence from Desktop Recordings はコメントを受け付けていません

LUDO: Low-Latency Understanding of Highly Deformable Objects using Point Cloud Occupancy Functions

要約 変形可能な物体の内部構造の形状と位置を正確に決定することは、ロボットによる … 続きを読む

カテゴリー: cs.CV, cs.RO | LUDO: Low-Latency Understanding of Highly Deformable Objects using Point Cloud Occupancy Functions はコメントを受け付けていません

Textured-GS: Gaussian Splatting with Spatially Defined Color and Opacity

要約 このペーパーでは、球面調和関数 (SH) を使用して空間的に定義された色と … 続きを読む

カテゴリー: cs.CV, I.4.0 | Textured-GS: Gaussian Splatting with Spatially Defined Color and Opacity はコメントを受け付けていません

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

要約 大規模言語モデル (LLM) の最近の進歩により、マルチモーダル LLM … 続きを読む

カテゴリー: cs.CL, cs.CV | Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective はコメントを受け付けていません

GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting

要約 非常にまばらなビューから 3D オブジェクトを再構築してレンダリングするこ … 続きを読む

カテゴリー: cs.CV, cs.GR | GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting はコメントを受け付けていません

Multimodal Instruction Tuning with Hybrid State Space Models

要約 長いコンテキストの処理は、高解像度画像や高フレーム レート ビデオの処理な … 続きを読む

カテゴリー: cs.CV | Multimodal Instruction Tuning with Hybrid State Space Models はコメントを受け付けていません