投稿者「jarxiv」のアーカイブ

ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning

投稿日: 2025年1月9日作成者: jarxiv

要約テキストからビデオへの生成は、普及モデルを通じて目覚ましい進歩を遂げました … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EditAR: Unified Conditional Generation with Autoregressive Models

投稿日: 2025年1月9日作成者: jarxiv

要約制御可能な画像の生成と編集における最近の進歩は、主に拡散ベースの方法によっ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures

投稿日: 2025年1月9日作成者: jarxiv

要約この研究では、生物学的ニューラルネットワークと同様の進化パターンを持つ人 … 続きを読む →

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, cs.NE | コメントを受け付けていません

Click2Mask: Local Editing with Dynamic Mask Generation

投稿日: 2025年1月9日作成者: jarxiv

要約生成モデルの最近の進歩により、画像の生成と編集に革命が起こり、専門家でなく … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

LiLMaps: Learnable Implicit Language Maps

投稿日: 2025年1月9日作成者: jarxiv

要約ロボット工学の現在のトレンドの 1 つは、大規模言語モデル (LLM) を … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

投稿日: 2025年1月9日作成者: jarxiv

要約私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

MADation: Face Morphing Attack Detection with Foundation Models

投稿日: 2025年1月9日作成者: jarxiv

要約近年、顔認識アルゴリズムのパフォーマンスが大幅に向上しているにもかかわらず … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving

投稿日: 2025年1月9日作成者: jarxiv

要約この研究は、大規模言語モデル (LLM) の文脈推論機能を活用することで、 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

投稿日: 2025年1月9日作成者: jarxiv

要約急速な発展が見られる一方で、リモートセンシングによる物体検出は依然として高 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LiLMaps: Learnable Implicit Language Maps

投稿日: 2025年1月8日作成者: jarxiv

要約ロボット工学の現在のトレンドの 1 つは、大規模言語モデル (LLM) を … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning

EditAR: Unified Conditional Generation with Autoregressive Models

Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures

Click2Mask: Local Editing with Dynamic Mask Generation

LiLMaps: Learnable Implicit Language Maps

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

MADation: Face Morphing Attack Detection with Foundation Models

SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving

Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

LiLMaps: Learnable Implicit Language Maps

最近の投稿

最近のコメント

アーカイブ

カテゴリー