投稿者「jarxiv」のアーカイブ

ZIP: An Efficient Zeroth-order Prompt Tuning for Black-box Vision-Language Models

投稿日: 2025年4月10日作成者: jarxiv

要約最近の研究では、ブラックボックスプロンプトチューニング（BBPT）と呼ばれ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Classifying the Unknown: In-Context Learning for Open-Vocabulary Text and Symbol Recognition

投稿日: 2025年4月10日作成者: jarxiv

要約マルチモーダルのコンテキスト学習（MICL）を活用するマルチモーダルモデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unified CNNs and transformers underlying learning mechanism reveals multi-head attention modus vivendi

投稿日: 2025年4月10日作成者: jarxiv

要約畳み込みニューラルネットワーク（CNNS）は、レイヤーに沿って進行する入力 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CasTex: Cascaded Text-to-Texture Synthesis via Explicit Texture Maps and Physically-Based Shading

投稿日: 2025年4月10日作成者: jarxiv

要約この作業では、拡散モデルを使用してテキストからテキストの合成を調査し、物理 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation

投稿日: 2025年4月10日作成者: jarxiv

要約ゼロショット、トレーニングフリー、画像ベースのテキストツービデオツージェネ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MovSAM: A Single-image Moving Object Segmentation Framework Based on Deep Thinking

投稿日: 2025年4月10日作成者: jarxiv

要約移動オブジェクトセグメンテーションは、動的な視覚環境を理解する上で重要な役 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes

投稿日: 2025年4月10日作成者: jarxiv

要約乱雑な環境で堅牢な把握が継続して、ロボット工学のオープンな課題のままです。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Joint Retrieval of Cloud properties using Attention-based Deep Learning Models

投稿日: 2025年4月10日作成者: jarxiv

要約正確なクラウドプロパティの検索は、雲の動作と気候への影響を理解するために不 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SEAL: Semantic Aware Image Watermarking

投稿日: 2025年4月10日作成者: jarxiv

要約生成モデルは急速に進化して現実的な出力を生成しています。しかし、それらの … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Compound and Parallel Modes of Tropical Convolutional Neural Networks

投稿日: 2025年4月10日作成者: jarxiv

要約畳み込みニューラルネットワークはますます深く複雑になり、計算コストが高くな … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.6 | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

ZIP: An Efficient Zeroth-order Prompt Tuning for Black-box Vision-Language Models

Classifying the Unknown: In-Context Learning for Open-Vocabulary Text and Symbol Recognition

Unified CNNs and transformers underlying learning mechanism reveals multi-head attention modus vivendi

CasTex: Cascaded Text-to-Texture Synthesis via Explicit Texture Maps and Physically-Based Shading

EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation

MovSAM: A Single-image Moving Object Segmentation Framework Based on Deep Thinking

GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes

Joint Retrieval of Cloud properties using Attention-based Deep Learning Models

SEAL: Semantic Aware Image Watermarking

Compound and Parallel Modes of Tropical Convolutional Neural Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー