Escalable desde un sólo chip hasta los que se necesiten, este acelerador de redes neuronales profundas proporciona las herramientas necesarias para soportar futuras capas de red no provistas a día de hoy, estando con ello preparado para afrontar el futuro.
La californiana Cadence Design Systems ha anunciado su nuevo procesador IP Tensilica DNA 100 para su uso como acelerador en redes neuronales profundas (DNA por sus siglas en inglés).
Este chip busca proporcionar alto rendimiento combinado con un consumo eficiente a un abanico de computadoras que va desde los 0,5 TeraMAC (TMAC) hasta centenares de TMAC. Los tipos de aplicaciones para los que puede resultar útil con este enfoque son las de redes neuronales de inferencia en dispositivos como, por ejemplo, vehículos autónomos, asistencia avanzada al pilotaje (ADAS), vigilancia, robótica, drones, realidad aumentada y virtual (AR/VR), smartphones, domótica (hogar inteligente), e IoT.
Según afirman desde Cadence, el Tensilica DNA 100 proporciona un rendimiento que mejora en un factor de 4,7 el rendimiento por vatio y lo aumenta en un factor de 2,3 en comparación con otras soluciones con dimensiones de array multiplicador-acumulador (MAC) similares.
Este acelerador de redes neuronales profundas dispone de un hardware especializado que elimina el consumo innecesario en la carga y multiplicación de zeros que presentan otros procesadores.
Esto, que dota a este procesador de mayor eficiencia, permite al Tensilica DNA 100 maximizar el rendimiento con un array de menor tamaño. Como muestra de esto, tenemos su habilidad para conseguir un rendimiento de inferencia en dispositivo estimado de 2.550 fps (frames por segundo) y hasta 2,4 TMACs/W (en 16 nm) en ResNet 50 para una configuración MAC 4K.
Software para el acelerador de redes neuronales profundas
Cadence también se ha encargado de dotar a su más reciente creación de una completa plataforma software de inteligencia artificial. La compatibilidad con la última versión del compilador Tensilica Neural Network proporciona el soporte para frameworks avanzados de inteligencia artificial tales como Caffe, TensorFlow, TensorFlow Lite, así como a un amplio espectro de redes neuronales, incluyendo convolution y redes recurrentes.
También dispone de soporte para la API de red neuronal de Android (ANN) para inferencia AI en dispositivos equipados con Android.
Uno solo de estos procesadores es capaz de ejecutar todas las capas de la red neuronal, incluyendo convolution, fully connected, LSTM, LRN, y pooling, además de poder escalar de forma simple desde 0,5 hasta 12 TMACs efectivos. En el caso de múltiples unidades, estas pueden ser apiladas para llegar a los centenares de TMACs antes citados. Y también soporta el compilador abierto de machine learning Facebook Glow.
El Tensilica DNA 100 incorpora también un DSP Tensilica que le permitiría acomodar cualquier capa de red neuronal que no sea soportada actualmente por los motoreshardware dentro del procesador. Está, por lo tanto, asegurado ante el futuro.
Por si esto último fuera poco, ofrece la extensibilidad y programabilidad del núcleo Tensilica Xtensa utilizando las instrucciones Tensilica Instruction Extension, disponiendo de su propio acceso directo a memoria (DMA). Esto último le permite correr otro código de control sin requerir un controlador separado.
El retoque de imágenes, la detección de rostros y su clasificación o identificación, o la asistencia al uso del lenguaje natural por parte de asistentes de voz son algunas de las tareas en las que puede ser empleado.
En nuestra editorial utilizamos cookies que nos permiten ofrecer y mejorar nuestros servicios. Si sigue leyendo nuestro periódico técnico online, acepta el uso que hacemos de las cookies para mejorar su experiencia y navegación. Al hacer clic en el botón ACEPTAR, consiente en el uso de todas las cookies.
Nuestro periódico técnico online utiliza cookies para mejorar su experiencia mientras navega por el sitio web. De estas, las cookies que se clasifican como necesarias se almacenan en su navegador, ya que son esenciales para el funcionamiento de las funcionalidades básicas del sitio web.
También utilizamos cookies de terceros que nos ayudan a analizar y comprender cómo utiliza nuestro periódico técnico online. Estas cookies se almacenarán en su navegador solo con su consentimiento y tiene la opción de optar por no recibir estas cookies. Pero la exclusión voluntaria de algunas de estas cookies puede afectar su experiencia de navegación.
Las cookies necesarias son absolutamente esenciales para que nuestro periódico técnico online funcione correctamente. Esta categoría solo incluye cookies que garantizan funcionalidades básicas y características de seguridad. No almacenan ninguna información personal.
Las cookies que pueden no ser particularmente necesarias para que el nuestro periódico técnico online funcione, y se utilizan específicamente para recopilar datos personales del usuario a través de análisis, anuncios y otros contenidos integrados, se denominan cookies no necesarias. Por esto, es obligatorio obtener el consentimiento del usuario antes de ejecutar estas cookies.