Elija su país o región.

Close
Iniciar sesión Regístrese Email:Info@infinity-electronic.com
0 Item(s)

El acelerador de red neuronal basado en FPGA supera a las GPU

Se demostró como una CNN de inicio de GoogLeNet-v1, utilizando una resolución de entero de ocho bits. Alcanzó 16,8 operaciones de tierra por segundo (TOPS) y puede inferir más de 5,300 imágenes por segundo en una Xilinx Virtex UltraScale + XCVU9P-3 fpga. El enfoque modular y escalable lo hace adecuado para la detección de objetos y aplicaciones de procesamiento de video en el borde y en la nube, explicó Fawcett, así como para la inferencia en centros de datos y cámaras inteligentes.

La DPU puede configurarse para proporcionar un rendimiento de cómputo óptimo para las topologías de redes neuronales en aplicaciones de aprendizaje automático, utilizando la arquitectura DSP paralela, la memoria distribuida y la reconfigurabilidad de la lógica y la conectividad para diferentes algoritmos.

La DPU logra un rendimiento un 50% más alto que cualquier CNN de la competencia y supera a las GPU para un determinado presupuesto de energía o costo, afirma la compañía. "El fpga es una plataforma y arquitectura que supera a todo el mundo, que es muy flexible para el futuro y puede superar a las GPU en IA, con menor latencia", agregó Fawcett.

La compañía también ha anunciado que está patrocinando un DPhil (PhD0 en la Universidad de Oxford para estudiar técnicas para implementar la aceleración del aprendizaje profundo en fpgas. El trabajo será en colaboración con la propia investigación de Omnitek sobre motores y algoritmos informáticos de IA.