Inicio CEVA Procesadores de IA en el edge NeuPro-M

Procesadores de IA en el edge NeuPro-M

691
0

Con una arquitectura que les permite ofrecer un rendimiento que parte de los 20 TOPS, los procesadores de IA en el edge NeuPro-M pueden llegar hasta los 1.200 TOPS.

CEVA, compañía especializada en conectividad inalámbrica y tecnologías de sensorización inteligente, presenta los NPM11 y NPM18, sus nuevos procesadores de inteligencia artificial para aplicaciones en el borde de la red (edge) pertenecientes a la gama NeuPro-M.

Pensados para abordar tareas de inferencia de inteligencia artificial y machine learning (AI/ML), los procesadores de IA en el edge NeuPro-M está basado en una arquitectura heterogénea autocontenida que se compone de múltiples coprocesadores especializados y aceleradores de hardware configurables que procesan de forma simultánea diversas tareas de redes neuronales profundas. Con esto, incrementan su rendimiento multiplicándolo por un factor de cinco o diez respecto a la serie inmediatamente predecesora.

Características destacables

Soportan tanto la escalabilidad SoC (system-on-chip) como la HSoC (Heterogeneous SoC), y consiguen ofrecer un rendimiento de hasta 1.200 TOPS. Además, y para mejorar la seguridad de los sistemas a los que equipan, integran arranque seguro y privacidad de datos de extremo a extremo.

El NPM11 dispone de un único motor NeuPro-M, funciona a 1,25 GHz y es capaz de entregar un rendimiento de hasta 20 TOPS, mientras que el NPM18 integra ocho motores NeuPro-M funcionando a la misma frecuencia de reloj de 1,25 GHz, con lo que ofrece un rendimiento de hasta 160 TOPS.

Procesadores de IA en el edge NeuPro-M

NeuPro-M es capaz de procesar todas las arquitecturas de red neuronal conocidas, así como de integrar soporte nativo para la próxima generación de redes, como transformadores, convolución 3D, autoatención, y todos los tipos de redes neuronales recurrentes. Ha sido optimizado para procesar más de 250 redes neuronales, más de 450 kernels (núcleos) IA, y más de 50 algoritmos.

Entre sus principales características arquitecturales tenemos que la matriz de la cuadrícula principal consiste en 4.000 MACs (Multiply And Accumulates) con precisión mixta de 2-16 bits, motor de transformación Winograd para pesos y activaciones, lo que les permite reducir el tiempo de convolución en un factor de 2X y permite un procesamiento de convolución de 8 bits con una degradación de precisión de menos del 0,5%.

Dejar una respuesta

Please enter your comment!
Please enter your name here

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.