「cs.AI」カテゴリーアーカイブ

PARAMANU-GANITA: Language Model with Mathematical Capabilities

投稿日: 2024年4月23日作成者: jarxiv

要約この論文では、数学に基づいた 2 億 800 万パラメータの新しい自動回帰 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Unified Framework for Model Editing

投稿日: 2024年4月23日作成者: jarxiv

要約私たちは、2 つの主要な「検索して編集」モデル編集手法である ROME と … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SpaceByte: Towards Deleting Tokenization from Large Language Modeling

投稿日: 2024年4月23日作成者: jarxiv

要約トークン化はパフォーマンスを大幅に向上させるため、大規模な言語モデルで広く … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image

投稿日: 2024年4月23日作成者: jarxiv

要約自動車は人類の経済活動、特に大都市において重要な役割を果たしています。こ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery

投稿日: 2024年4月23日作成者: jarxiv

要約オープンワールド物体検出 (OWOD) は実際に使用されているため、最近大 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

投稿日: 2024年4月23日作成者: jarxiv

要約急速に開発されているラージビジョン言語モデル (LVLM) は、さまざま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning

投稿日: 2024年4月23日作成者: jarxiv

要約 ECG 信号分析 (1D)、画像分類 (2D)、ビデオ分類 (3D) に及 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG, cs.MA | コメントを受け付けていません

UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation

投稿日: 2024年4月23日作成者: jarxiv

要約都市化の課題は、都市アプリケーション向けの地理的セマンティクスが強化された … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Automatic Discovery of Visual Circuits

投稿日: 2024年4月23日作成者: jarxiv

要約これまで、人間が解釈可能な計算を深視力モデルに実装するネットワークサブコ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Graphic Design with Large Multimodal Model

投稿日: 2024年4月23日作成者: jarxiv

要約グラフィックデザインの分野では、デザイン要素を統合した一体性のある多層ア … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

PARAMANU-GANITA: Language Model with Mathematical Capabilities

A Unified Framework for Model Editing

SpaceByte: Towards Deleting Tokenization from Large Language Modeling

BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image

YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning

UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation

Automatic Discovery of Visual Circuits

Graphic Design with Large Multimodal Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー