月別アーカイブ: 2024年2月

ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning

要約 最近、多くの汎用性の高いマルチモーダル大規模言語モデル (MLLM) が継 … 続きを読む

カテゴリー: cs.CV | ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning はコメントを受け付けていません

Adversarial Feature Alignment: Balancing Robustness and Accuracy in Deep Learning via Adversarial Training

要約 深層学習モデルの精度は向上し続けていますが、依然として敵対的な攻撃に対して … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG, D.2.7 | Adversarial Feature Alignment: Balancing Robustness and Accuracy in Deep Learning via Adversarial Training はコメントを受け付けていません

Pan-Mamba: Effective pan-sharpening with State Space Model

要約 パンシャープニングでは、低解像度のマルチスペクトル画像と高解像度のパンクロ … 続きを読む

カテゴリー: cs.CV | Pan-Mamba: Effective pan-sharpening with State Space Model はコメントを受け付けていません

Zero shot VLMs for hate meme detection: Are we there yet?

要約 ソーシャル メディア上のマルチメディア コンテンツは急速に進化しており、ミ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Zero shot VLMs for hate meme detection: Are we there yet? はコメントを受け付けていません

LaneGraph2Seq: Lane Topology Extraction with Language Model via Vertex-Edge Encoding and Connectivity Enhancement

要約 自動運転には道路構造の理解が重要です。 複雑な道路構造は、多くの場合、有向 … 続きを読む

カテゴリー: cs.CV | LaneGraph2Seq: Lane Topology Extraction with Language Model via Vertex-Edge Encoding and Connectivity Enhancement はコメントを受け付けていません

Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability

要約 自己回帰モデルは、グリッド空間内の結合分布をモデル化することにより、2D … 続きを読む

カテゴリー: cs.CV | Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability はコメントを受け付けていません

AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling

要約 AnyGPT は、音声、テキスト、画像、音楽などのさまざまなモダリティの統 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling はコメントを受け付けていません

Task-Specific Normalization for Continual Learning of Blind Image Quality Models

要約 この論文では、品質予測精度、可塑性と安定性のトレードオフ、およびタスク順序 … 続きを読む

カテゴリー: cs.CV | Task-Specific Normalization for Continual Learning of Blind Image Quality Models はコメントを受け付けていません

Mixed Gaussian Flow for Diverse Trajectory Prediction

要約 既存の軌道予測研究は生成モデルを集中的に活用しています。 フローの正規化は … 続きを読む

カテゴリー: cs.CV | Mixed Gaussian Flow for Diverse Trajectory Prediction はコメントを受け付けていません

Open3DSG: Open-Vocabulary 3D Scene Graphs from Point Clouds with Queryable Objects and Open-Set Relationships

要約 3D シーン グラフ予測の現在のアプローチは、ラベル付きデータセットに依存 … 続きを読む

カテゴリー: cs.CV | Open3DSG: Open-Vocabulary 3D Scene Graphs from Point Clouds with Queryable Objects and Open-Set Relationships はコメントを受け付けていません