cs.CV」カテゴリーアーカイブ

VideoDirector: Precise Video Editing via Text-to-Video Models

要約 テキストから画像 (T2I) モデルを使用した典型的な反転してから編集する … 続きを読む

カテゴリー: cs.CV | VideoDirector: Precise Video Editing via Text-to-Video Models はコメントを受け付けていません

P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images

要約 リモート センシング画像から建物の輪郭を抽出することは、建物の複雑で多様な … 続きを読む

カテゴリー: cs.CV | P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images はコメントを受け付けていません

Image segmentation of treated and untreated tumor spheroids by Fully Convolutional Networks

要約 多細胞腫瘍スフェロイド (MCTS) は、併用放射線 (化学) 療法の影響 … 続きを読む

カテゴリー: cs.CV, q-bio.QM, q-bio.TO | Image segmentation of treated and untreated tumor spheroids by Fully Convolutional Networks はコメントを受け付けていません

Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models

要約 低ランク適応 (LoRA) は、基礎モデルを効率的に微調整するための一般的 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.DC | Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models はコメントを受け付けていません

MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks

要約 最近、人間の動作分析は、ノイズ除去拡散モデルや大規模言語モデルなどの刺激的 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks はコメントを受け付けていません

A Survey on Multimodal Large Language Models

要約 最近、GPT-4V に代表されるマルチモーダル大規模言語モデル (MLLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | A Survey on Multimodal Large Language Models はコメントを受け付けていません

Aggregating Nearest Sharp Features via Hybrid Transformers for Video Deblurring

要約 特定のぼやけたビデオから連続した鮮明なフレームを復元することを目的としたビ … 続きを読む

カテゴリー: cs.CV, I.4.3 | Aggregating Nearest Sharp Features via Hybrid Transformers for Video Deblurring はコメントを受け付けていません

Efficient Text-driven Motion Generation via Latent Consistency Training

要約 拡散戦略に基づくテキスト駆動の人間の動作生成は、人間とコンピューターの対話 … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient Text-driven Motion Generation via Latent Consistency Training はコメントを受け付けていません

Gaussian multi-target filtering with target dynamics driven by a stochastic differential equation

要約 この論文では、ターゲットのダイナミクスが連続時間で与えられ、測定値が離散時 … 続きを読む

カテゴリー: cs.CV, eess.SP, math.PR, stat.CO | Gaussian multi-target filtering with target dynamics driven by a stochastic differential equation はコメントを受け付けていません

Hybrid Architecture for Real-Time Video Anomaly Detection: Integrating Spatial and Temporal Analysis

要約 この論文では、空間分析と時間分析を組み合わせた人間の行動にヒントを得た、ビ … 続きを読む

カテゴリー: cs.CV | Hybrid Architecture for Real-Time Video Anomaly Detection: Integrating Spatial and Temporal Analysis はコメントを受け付けていません