月別アーカイブ: 2024年8月

Edit As You Wish: Video Caption Editing with Multi-grained User Control

要約 ユーザーのリクエストに応じて自然言語でビデオを自動的にナレーションすること … 続きを読む

カテゴリー: cs.CV, cs.MM | Edit As You Wish: Video Caption Editing with Multi-grained User Control はコメントを受け付けていません

Enhancing Journalism with AI: A Study of Contextualized Image Captioning for News Articles using LLMs and LMMs

要約 大規模言語モデル (LLM) と大規模マルチモーダル モデル (LMM) … 続きを読む

カテゴリー: cs.CL, cs.CV | Enhancing Journalism with AI: A Study of Contextualized Image Captioning for News Articles using LLMs and LMMs はコメントを受け付けていません

HARMamba: Efficient and Lightweight Wearable Sensor Human Activity Recognition Based on Bidirectional Mamba

要約 ウェアラブル センサー ベースの人間活動認識 (HAR) は、活動認識にお … 続きを読む

カテゴリー: cs.AI, cs.CV | HARMamba: Efficient and Lightweight Wearable Sensor Human Activity Recognition Based on Bidirectional Mamba はコメントを受け付けていません

Fast and Accurate Object Detection on Asymmetrical Receptive Field

要約 物体検出は幅広い業界で使用されています。 たとえば、自動運転における物体検 … 続きを読む

カテゴリー: cs.CV | Fast and Accurate Object Detection on Asymmetrical Receptive Field はコメントを受け付けていません

Self-supervised visual learning from interactions with objects

要約 自己教師あり学習 (SSL) は視覚表現学習に革命をもたらしましたが、人間 … 続きを読む

カテゴリー: cs.CV, cs.LG | Self-supervised visual learning from interactions with objects はコメントを受け付けていません

AggSS: An Aggregated Self-Supervised Approach for Class-Incremental Learning

要約 この論文では、自己教師あり学習、特に画像の回転がさまざまなクラス増分学習パ … 続きを読む

カテゴリー: cs.CV | AggSS: An Aggregated Self-Supervised Approach for Class-Incremental Learning はコメントを受け付けていません

Detecting Car Speed using Object Detection and Depth Estimation: A Deep Learning Framework

要約 交通事故は世界のほぼすべての地域で非常に頻繁に発生しており、死亡事故の大多 … 続きを読む

カテゴリー: cs.CV, cs.LG | Detecting Car Speed using Object Detection and Depth Estimation: A Deep Learning Framework はコメントを受け付けていません

MultiViPerFrOG: A Globally Optimized Multi-Viewpoint Perception Framework for Camera Motion and Tissue Deformation

要約 移動深度カメラによって捕捉された情報から変形可能な環境の 3D 形状を再構 … 続きを読む

カテゴリー: cs.CV | MultiViPerFrOG: A Globally Optimized Multi-Viewpoint Perception Framework for Camera Motion and Tissue Deformation はコメントを受け付けていません

GenAD: Generalized Predictive Model for Autonomous Driving

要約 この論文では、自動運転分野における初の大規模ビデオ予測モデルを紹介します。 … 続きを読む

カテゴリー: cs.CV | GenAD: Generalized Predictive Model for Autonomous Driving はコメントを受け付けていません

P2LHAP:Wearable sensor-based human activity recognition, segmentation and forecast through Patch-to-Label Seq2Seq Transformer

要約 従来の深層学習手法では、センサー データから人間の活動を同時にセグメント化 … 続きを読む

カテゴリー: cs.AI, cs.CV | P2LHAP:Wearable sensor-based human activity recognition, segmentation and forecast through Patch-to-Label Seq2Seq Transformer はコメントを受け付けていません