月別アーカイブ: 2024年8月

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

投稿日: 2024年8月27日作成者: jarxiv

要約既存の方法では大規模なモデルアーキテクチャが必要となり、高い計算量とリソ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

投稿日: 2024年8月27日作成者: jarxiv

要約ディープ畳み込みニューラルネットワーク (CNN) は、幅広い画像処理ア … 続きを読む →

カテゴリー: 65N55, 68T07, 68W10, 68W15, cs.CV, cs.LG, cs.NA, math.NA | コメントを受け付けていません

Center Direction Network for Grasping Point Localization on Cloths

投稿日: 2024年8月27日作成者: jarxiv

要約物体の把握はロボット工学とコンピュータビジョンにおける基本的な課題であり、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

投稿日: 2024年8月27日作成者: jarxiv

要約オブジェクトの計数と位置特定の問題は、一般的にポイント教師あり学習で対処さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

投稿日: 2024年8月27日作成者: jarxiv

要約この論文では、長い形式の自己中心的なビデオにおけるマルチホップビデオ質問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Practitioner’s Guide to Continual Multimodal Pretraining

投稿日: 2024年8月27日作成者: jarxiv

要約マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

投稿日: 2024年8月27日作成者: jarxiv

要約偏微分方程式 (PDE) は、特に生物学の領域において、複雑な自然プロセス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Ten Problems in Geobotics

投稿日: 2024年8月27日作成者: jarxiv

要約ロボットは物理世界で感知し、動き、行動します。したがって、ロボット工学や … 続きを読む →

カテゴリー: cs.CG, cs.RO | コメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

投稿日: 2024年8月27日作成者: jarxiv

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

投稿日: 2024年8月27日作成者: jarxiv

要約テキストプロンプトから高密度のマルチビューイメージを生成することは、忠 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年8月

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

Center Direction Network for Grasping Point Localization on Cloths

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

A Practitioner’s Guide to Continual Multimodal Pretraining

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

Ten Problems in Geobotics

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

最近の投稿

最近のコメント

アーカイブ

カテゴリー