月別アーカイブ: 2024年9月

Open-vocabulary Temporal Action Localization using VLMs

要約 ビデオ アクションのローカリゼーションは、長いビデオから特定のアクションの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Open-vocabulary Temporal Action Localization using VLMs はコメントを受け付けていません

CinePreGen: Camera Controllable Video Previsualization via Engine-powered Diffusion

要約 ビデオ生成 AI モデル (SORA など) の進歩に伴い、クリエイターは … 続きを読む

カテゴリー: cs.CV, cs.HC | CinePreGen: Camera Controllable Video Previsualization via Engine-powered Diffusion はコメントを受け付けていません

DARES: Depth Anything in Robotic Endoscopic Surgery with Self-supervised Vector-LoRA of the Foundation Model

要約 ロボット支援手術 (RAS) は、3D 再構築と視覚化のための正確な深度推 … 続きを読む

カテゴリー: cs.CV | DARES: Depth Anything in Robotic Endoscopic Surgery with Self-supervised Vector-LoRA of the Foundation Model はコメントを受け付けていません

Frankenstein: Generating Semantic-Compositional 3D Scenes in One Tri-Plane

要約 私たちは、シングル パスでセマンティック構成の 3D シーンを生成できる拡 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Frankenstein: Generating Semantic-Compositional 3D Scenes in One Tri-Plane はコメントを受け付けていません

Bridging Episodes and Semantics: A Novel Framework for Long-Form Video Understanding

要約 既存の研究では、長い形式のビデオを拡張された短いビデオとして扱うことがよく … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Bridging Episodes and Semantics: A Novel Framework for Long-Form Video Understanding はコメントを受け付けていません

Addressing the challenges of loop detection in agricultural environments

要約 視覚的な SLAM システムは十分に研究されており、屋内および都市環境では … 続きを読む

カテゴリー: cs.CV, cs.RO | Addressing the challenges of loop detection in agricultural environments はコメントを受け付けていません

OpticalRS-4M: Scaling Efficient Masked Autoencoder Learning on Large Remote Sensing Dataset

要約 マスク イメージ モデリング (MIM) は、リモート センシング (RS … 続きを読む

カテゴリー: cs.CV | OpticalRS-4M: Scaling Efficient Masked Autoencoder Learning on Large Remote Sensing Dataset はコメントを受け付けていません

Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.SD, eess.AS | Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming はコメントを受け付けていません

Dissecting Out-of-Distribution Detection and Open-Set Recognition: A Critical Analysis of Methods and Benchmarks

要約 テスト時間の分布シフトの検出は、機械学習モデルを安全に導入するための重要な … 続きを読む

カテゴリー: cs.AI, cs.CV | Dissecting Out-of-Distribution Detection and Open-Set Recognition: A Critical Analysis of Methods and Benchmarks はコメントを受け付けていません