cs.CV」カテゴリーアーカイブ

Brainformer: Mimic Human Visual Brain Functions to Machine Vision Models via fMRI

要約 人間の知覚は、信念を形成し、現実を理解する上で重要な役割を果たします。 脳 … 続きを読む

カテゴリー: cs.CV | Brainformer: Mimic Human Visual Brain Functions to Machine Vision Models via fMRI はコメントを受け付けていません

BRACTIVE: A Brain Activation Approach to Human Visual Brain Learning

要約 人間の脳は非常に効率的な処理装置であり、その仕組みを理解することで、機械学 … 続きを読む

カテゴリー: cs.CV | BRACTIVE: A Brain Activation Approach to Human Visual Brain Learning はコメントを受け付けていません

Health AI Developer Foundations

要約 堅牢な医療機械学習 (ML) モデルは、臨床研究を加速し、ワークフローと結 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, eess.IV | Health AI Developer Foundations はコメントを受け付けていません

SAMWISE: Infusing wisdom in SAM2 for Text-Driven Video Segmentation

要約 参照ビデオ オブジェクト セグメンテーション (RVOS) は、自然言語表 … 続きを読む

カテゴリー: cs.CV | SAMWISE: Infusing wisdom in SAM2 for Text-Driven Video Segmentation はコメントを受け付けていません

DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting

要約 シーン合成の最近の進歩により、レンダリング目標を使用したハイパープリミティ … 続きを読む

カテゴリー: cs.CV | DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting はコメントを受け付けていません

RoboPEPP: Vision-Based Robot Pose and Joint Angle Estimation through Embedding Predictive Pre-Training

要約 関節角度が未知の多関節ロボットの視覚ベースの姿勢推定は、協調ロボット工学や … 続きを読む

カテゴリー: cs.CV, cs.RO | RoboPEPP: Vision-Based Robot Pose and Joint Angle Estimation through Embedding Predictive Pre-Training はコメントを受け付けていません

SketchAgent: Language-Driven Sequential Sketch Generation

要約 スケッチはアイデアを外部化するための多用途ツールとして機能し、さまざまな分 … 続きを読む

カテゴリー: cs.CV | SketchAgent: Language-Driven Sequential Sketch Generation はコメントを受け付けていません

Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration

要約 重いマルチモーダル大規模言語モデル (MLLM) の推論を高速化するために … 続きを読む

カテゴリー: cs.CV | Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration はコメントを受け付けていません

GenDeg: Diffusion-Based Degradation Synthesis for Generalizable All-in-One Image Restoration

要約 All-In-One Image Restoration (AIOR) 用 … 続きを読む

カテゴリー: cs.CV | GenDeg: Diffusion-Based Degradation Synthesis for Generalizable All-in-One Image Restoration はコメントを受け付けていません

Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis

要約 この論文では、マルチモーダル音声生成のための新しい技術を動機付けるために、 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis はコメントを受け付けていません