「cs.CV」カテゴリーアーカイブ

Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos

投稿日: 2024年11月14日作成者: jarxiv

要約マルチビュービデオが与えられた場合、人間の観察者にとってどの視点が最も有 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Weakly-Supervised Anomaly Detection in Surveillance Videos Based on Two-Stream I3D Convolution Network

投稿日: 2024年11月14日作成者: jarxiv

要約都市監視システムの広範な導入により、公共の安全を強化するために異常検出のた … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation

投稿日: 2024年11月14日作成者: jarxiv

要約半教師あり学習と自己教師あり学習はラベルなしデータから知識を効果的にモデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HiFi-Syn: Hierarchical Granularity Discrimination for High-Fidelity Synthesis of MR Images with Structure Preservation

投稿日: 2024年11月14日作成者: jarxiv

要約医療画像の構造情報を保存しながら医療画像を合成することは、医学研究において … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Sharingan: Extract User Action Sequence from Desktop Recordings

投稿日: 2024年11月14日作成者: jarxiv

要約ユーザーアクティビティのビデオ録画、特にデスクトップ録画は、ユーザーの行 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LUDO: Low-Latency Understanding of Highly Deformable Objects using Point Cloud Occupancy Functions

投稿日: 2024年11月14日作成者: jarxiv

要約変形可能な物体の内部構造の形状と位置を正確に決定することは、ロボットによる … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Textured-GS: Gaussian Splatting with Spatially Defined Color and Opacity

投稿日: 2024年11月14日作成者: jarxiv

要約このペーパーでは、球面調和関数 (SH) を使用して空間的に定義された色と … 続きを読む →

カテゴリー: cs.CV, I.4.0 | コメントを受け付けていません

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

投稿日: 2024年11月14日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩により、マルチモーダル LLM … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting

投稿日: 2024年11月14日作成者: jarxiv

要約非常にまばらなビューから 3D オブジェクトを再構築してレンダリングするこ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Multimodal Instruction Tuning with Hybrid State Space Models

投稿日: 2024年11月14日作成者: jarxiv

要約長いコンテキストの処理は、高解像度画像や高フレームレートビデオの処理な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos

Weakly-Supervised Anomaly Detection in Surveillance Videos Based on Two-Stream I3D Convolution Network

Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation

HiFi-Syn: Hierarchical Granularity Discrimination for High-Fidelity Synthesis of MR Images with Structure Preservation

Sharingan: Extract User Action Sequence from Desktop Recordings

LUDO: Low-Latency Understanding of Highly Deformable Objects using Point Cloud Occupancy Functions

Textured-GS: Gaussian Splatting with Spatially Defined Color and Opacity

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting

Multimodal Instruction Tuning with Hybrid State Space Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー