「cs.AI」カテゴリーアーカイブ

Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

投稿日: 2024年3月15日作成者: jarxiv

要約書いたり話したりするとき、人は時々立ち止まって考えることがあります。推論 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Rethinking Class-incremental Learning in the Era of Large Pre-trained Models via Test-Time Adaptation

投稿日: 2024年3月15日作成者: jarxiv

要約クラス増分学習 (CIL) は、以前に学習した情報を忘れることなく、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

What Sketch Explainability Really Means for Downstream Tasks

投稿日: 2024年3月15日作成者: jarxiv

要約この論文では、従来のピクセル指向の研究と比較して人間のストロークの重大な影 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation

投稿日: 2024年3月15日作成者: jarxiv

要約半教師ありセマンティックセグメンテーション (SSSS) は、大量のラベ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Don’t Judge by the Look: A Motion Coherent Augmentation for Video Recognition

投稿日: 2024年3月15日作成者: jarxiv

要約物体認識における現在のトレーニングパイプラインでは、分類に有害な外観の変 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding

投稿日: 2024年3月15日作成者: jarxiv

要約テキストからビジュアルコンポーネントへの進化により、テキストから画像やビデ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.GR | コメントを受け付けていません

TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions

投稿日: 2024年3月15日作成者: jarxiv

要約視覚的に破損した状態でのロボットのナビゲーションは、大きな課題となります。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Counterfactual contrastive learning: robust representations via causal image synthesis

投稿日: 2024年3月15日作成者: jarxiv

要約対照的な事前トレーニングは、特に限られたラベル設定において、下流のタスクの … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

3D-VLA: A 3D Vision-Language-Action Generative World Model

投稿日: 2024年3月15日作成者: jarxiv

要約最近のビジョン言語アクション (VLA) モデルは 2D 入力に依存してお … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models

投稿日: 2024年3月15日作成者: jarxiv

要約変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Rethinking Class-incremental Learning in the Era of Large Pre-trained Models via Test-Time Adaptation

What Sketch Explainability Really Means for Downstream Tasks

AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation

Don’t Judge by the Look: A Motion Coherent Augmentation for Video Recognition

VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding

TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions

Counterfactual contrastive learning: robust representations via causal image synthesis

3D-VLA: A 3D Vision-Language-Action Generative World Model

Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー