月別アーカイブ: 2024年9月

From Seconds to Hours: Reviewing MultiModal Large Language Models on Comprehensive Long Video Understanding

投稿日: 2024年9月30日作成者: jarxiv

要約最近、ラージ言語モデル (LLM) とビジュアルエンコーダーの統合により … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Spectral Wavelet Dropout: Regularization in the Wavelet Domain

投稿日: 2024年9月30日作成者: jarxiv

要約正則化技術は過学習を防止するのに役立ち、畳み込みニューラルネットワーク … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

UniCal: Unified Neural Sensor Calibration

投稿日: 2024年9月30日作成者: jarxiv

要約自動運転車 (SDV) では、自動運転のためにセンサーデータを正確に融合 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ProMerge: Prompt and Merge for Unsupervised Instance Segmentation

投稿日: 2024年9月30日作成者: jarxiv

要約教師なしインスタンスのセグメンテーションは、人間がラベル付けしたデータに依 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Exploring Token Pruning in Vision State Space Models

投稿日: 2024年9月30日作成者: jarxiv

要約状態空間モデル (SSM) には、トランスフォーマーのアテンションモジュ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

PhysGen: Rigid-Body Physics-Grounded Image-to-Video Generation

投稿日: 2024年9月30日作成者: jarxiv

要約我々は、単一の画像と入力条件 (画像内のオブジェクトに加えられる力やトルク … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Fine Tuning vs. Retrieval Augmented Generation for Less Popular Knowledge

投稿日: 2024年9月30日作成者: jarxiv

要約言語モデル (LM) は膨大な量の事実の知識を記憶し、さまざまなタスクや領 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Few-shot Pairwise Rank Prompting: An Effective Non-Parametric Retrieval Model

投稿日: 2024年9月30日作成者: jarxiv

要約教師ありランキングモデルは、効果的であるという利点にもかかわらず、通常は … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

BeanCounter: A low-toxicity, large-scale, and open dataset of business-oriented text

投稿日: 2024年9月30日作成者: jarxiv

要約言語モデリングにおける最近の進歩の多くは、同じモデルアーキテクチャをより … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learning Occlusion-aware Decision-making from Agent Interaction via Active Perception

投稿日: 2024年9月30日作成者: jarxiv

要約さまざまなオクルージョンの不確実性が高いため、自動運転ではオクルージョンを … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年9月

From Seconds to Hours: Reviewing MultiModal Large Language Models on Comprehensive Long Video Understanding

Spectral Wavelet Dropout: Regularization in the Wavelet Domain

UniCal: Unified Neural Sensor Calibration

ProMerge: Prompt and Merge for Unsupervised Instance Segmentation

Exploring Token Pruning in Vision State Space Models

PhysGen: Rigid-Body Physics-Grounded Image-to-Video Generation

Fine Tuning vs. Retrieval Augmented Generation for Less Popular Knowledge

Few-shot Pairwise Rank Prompting: An Effective Non-Parametric Retrieval Model

BeanCounter: A low-toxicity, large-scale, and open dataset of business-oriented text

Learning Occlusion-aware Decision-making from Agent Interaction via Active Perception

最近の投稿

最近のコメント

アーカイブ

カテゴリー