月別アーカイブ: 2024年3月

Simple and Scalable Strategies to Continually Pre-train Large Language Models

要約 大規模言語モデル (LLM) は、数十億のトークンで定期的に事前トレーニン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Simple and Scalable Strategies to Continually Pre-train Large Language Models はコメントを受け付けていません

UniLiDAR: Bridge the domain gap among different LiDARs for continual learning

要約 LiDAR ベースの 3D 認識アルゴリズムは、大規模なデータセットの出現 … 続きを読む

カテゴリー: cs.CV | UniLiDAR: Bridge the domain gap among different LiDARs for continual learning はコメントを受け付けていません

Pig aggression classification using CNN, Transformers and Recurrent Networks

要約 動物の行動の分析と検出に使用できる技術の開発は、ストレスと動物福祉を監視で … 続きを読む

カテゴリー: cs.AI, cs.CV | Pig aggression classification using CNN, Transformers and Recurrent Networks はコメントを受け付けていません

IPMix: Label-Preserving Data Augmentation Method for Training Robust Classifiers

要約 データ拡張は、過剰適合を防止することで、高精度の畳み込みニューラル ネット … 続きを読む

カテゴリー: cs.CV | IPMix: Label-Preserving Data Augmentation Method for Training Robust Classifiers はコメントを受け付けていません

Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning

要約 リモート センシング画像の数がますます増えているため、コストをかけて新たに … 続きを読む

カテゴリー: cs.CV | Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning はコメントを受け付けていません

HOLMES: HOLonym-MEronym based Semantic inspection for Convolutional Image Classifiers

要約 畳み込みニューラル ネットワーク (CNN) は、ビジュアル タスクにおけ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HOLMES: HOLonym-MEronym based Semantic inspection for Convolutional Image Classifiers はコメントを受け付けていません

AIGCs Confuse AI Too: Investigating and Explaining Synthetic Image-induced Hallucinations in Large Vision-Language Models

要約 人工知能生成コンテンツ (AIGC) の進化は、より高品質に向かって進んで … 続きを読む

カテゴリー: cs.CV | AIGCs Confuse AI Too: Investigating and Explaining Synthetic Image-induced Hallucinations in Large Vision-Language Models はコメントを受け付けていません

CINA: Conditional Implicit Neural Atlas for Spatio-Temporal Representation of Fetal Brains

要約 我々は、定型神経および病理学的胎児脳の磁気共鳴画像(MRI)から時空間アト … 続きを読む

カテゴリー: cs.CV, cs.LG | CINA: Conditional Implicit Neural Atlas for Spatio-Temporal Representation of Fetal Brains はコメントを受け付けていません

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV | GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting はコメントを受け付けていません

SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple Cameras and Scenes by One Model

要約 単眼計量深度推定 (MMDE) の一般化は長年の課題でした。 最近の方法は … 続きを読む

カテゴリー: cs.AI, cs.CV | SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple Cameras and Scenes by One Model はコメントを受け付けていません