月別アーカイブ: 2024年6月

Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis

要約 汎用人工知能の探求において、マルチモーダル大規模言語モデル (MLLM) … 続きを読む

カテゴリー: cs.CL, cs.CV | Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis はコメントを受け付けていません

URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images

要約 視覚的にも物理的にも現実的なシミュレーション シーンを構築することは、ロボ … 続きを読む

カテゴリー: cs.AI, cs.RO | URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images はコメントを受け付けていません

A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction

要約 シングルビュー画像から 3D シーン表現を学習することは、入力ビューからは … 続きを読む

カテゴリー: cs.CV | A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction はコメントを受け付けていません

Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals

要約 正確な骨の追跡は、整形外科や義肢ロボット工学における運動学的解析にとって非 … 続きを読む

カテゴリー: cs.LG, cs.RO, eess.SP | Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals はコメントを受け付けていません

Iterative Feature Boosting for Explainable Speech Emotion Recognition

要約 音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS, I.2.1 | Iterative Feature Boosting for Explainable Speech Emotion Recognition はコメントを受け付けていません

Visual Attention Analysis in Online Learning

要約 このペーパーでは、マルチモーダル学習分析分野におけるアプローチを紹介します … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | Visual Attention Analysis in Online Learning はコメントを受け付けていません

Scaling White-Box Transformers for Vision

要約 CRATE は、圧縮表現とスパース表現を学習するために設計されたホワイトボ … 続きを読む

カテゴリー: cs.CV | Scaling White-Box Transformers for Vision はコメントを受け付けていません

ParSEL: Parameterized Shape Editing with Language

要約 自然言語から 3D アセットを編集できる機能は、3D コンテンツ作成の民主 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.HC, cs.SC | ParSEL: Parameterized Shape Editing with Language はコメントを受け付けていません

4DHands: Reconstructing Interactive Hands in 4D with Transformers

要約 この論文では、インタラクティブなハンド メッシュとその相対的な動きを単眼入 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | 4DHands: Reconstructing Interactive Hands in 4D with Transformers はコメントを受け付けていません

KerasCV and KerasNLP: Vision and Language Power-Ups

要約 コンピューター ビジョンおよび自然言語処理ワークフロー用の Keras A … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SE, I.2.10 | KerasCV and KerasNLP: Vision and Language Power-Ups はコメントを受け付けていません