Învățarea profundă cu FPGA

!!! SUPER MEMORIA !!! Muzică pentru învățare și îmbunătățire a memoriei (Mai 2019).

$config[ads_text] not found
Anonim

Învățarea profundă cu FPGA


Iată de ce FPGA-urile fac incursiune, în ciuda faptului că GPU-urile sunt standarde de facto pentru implementarea algoritmilor de învățare profundă.

În învățare profundă, unitățile de procesare grafică sau unitățile de procesare grafică (GPU) au devenit arhitectura de calcul aleasă pentru viteza imaculată. Deci, de ce inginerii trebuiau să treacă la FPGA pentru a implementa algoritmi de învățare profundă atunci când unitățile de procesare grafică fac o treabă atât de fabuloasă și continuă să se îmbunătățească " />

Clusterele FPGA pot compensa viteza și performanțele asemănătoare GPU-ului.

Companiile ca Microsoft și gigantul de căutare chinez Baidu au atras atenția mai întâi asupra utilizării FPGA-urilor în aplicații profunde de învățare, acum câțiva ani. Ei au transferat algoritmi de învățare profundă pe FPGA-uri și au susținut că FPGA-urile au oferit o îmbunătățire semnificativă a vitezei la o fracțiune de consum de energie în comparație cu GPU-urile.

Microsoft, care rulează centre de date mari pentru motorul său de căutare Bing și alte operațiuni de calcul de înaltă performanță (HPC) precum norul Azure, a avut probleme în implementarea GPU-urilor ca singură sursă de calcul. Unitățile de procesare grafică sunt rapide și reprezintă un atribut cheie în lumea de învățare profundă a algoritmilor. Cu toate acestea, inginerii Microsoft au dorit să accelereze algoritmi de învățare profundă fără o creștere semnificativă a consumului de energie.

Apoi, a existat această problemă a cererii mai mici la un moment dat, care a lăsat o mulțime de capacitate GPU neutilizate. Deci, Microsoft a decis să utilizeze cele mai ieftine FPGA - Altera Startix 5-în operațiunile de prelucrare a algoritmilor de clasificare a căutării lui Bing. Gigantul de calcul a înregistrat o creștere a performanței globale cu un factor de 2x când a socotit costul serverelor și consumul de energie.

Oportunități și provocări

Acum, luați alte arhitecturi FPGA ale lui Altera, pe care Microsoft le utilizează în designul acceleratorului rețelei neuronale convulsive (CNN). Ea procesează 233 de imagini într-o secundă în timp ce consumă 25 de wați. Pe de altă parte, GPU-ul Tesla K40 de la NVIDIA procesează între 500 și 824 imagini într-o secundă, în timp ce desenează 235 de wați.

În cele din urmă, trei FPGA-uri pot fi implementate pentru a atinge puterea de procesare echivalentă cu GPU-ul NVIDIA și va reduce consumul de energie cu aproape 30%. Asta face ca FPGA să fie o alternativă credibilă pentru aplicațiile grele de calcul în domeniul profund de învățare.

FPGA-urile vor fi, de asemenea, o alegere probabilă pentru sistemele încorporate, deoarece acestea sunt computațional intensive și sprijină aplicații în timp real. Apoi, există o diversitate mai mare de funcții pe care FPGA-urile le pot executa în timp ce pot configura rapid numărul de straturi și dimensiuni în plasă.

TeraDeep utilizează FPGA pentru a oferi procesare în serie pentru a se potrivi vitezei GPU. Imaginea este oferită de TeraDeep.

Xilinx, nemesisul lui Altera pe piața FPGA, a făcut o investiție în TeraDeep, o firmă care accelerează algoritmi de învățare profundă folosind Xilinx FPGAs. TeraDeep este un extras dintr-un proiect de cercetare de la Universitatea Purdue care a căutat CNN-uri cu mai multe straturi pentru a efectua procesarea imaginilor și sarcini similare, cum ar fi recunoașterea vorbirii.

Cu toate acestea, în timp ce FPGA câștigă lumina reflectoarelor ca un accelerator de învățare profundă, cu un plic cu putere redusă, un obstacol cheie în dificultate în programarea FPGA-urilor. Spre deosebire de unitățile de procesare grafică (GPU), care rulează pe software, inginerii trebuie să transforme un algoritm software într-un bloc hardware înainte de a-l cartografia pe FPGA.

Dezvoltarea aprofundată a aplicațiilor pentru FPGA se află încă în stadii incipiente, iar companiile mari precum Microsoft sunt în măsură să utilizeze unitățile de procesare grafică pentru modelele de instruire în timp ce le transferă la FPGA pentru încărcarea producției. Între timp, FPGA vor continua, cel mai probabil, să facă performanțe și eficiență.

Cea de-a treia și ultima parte a seriei despre învățarea profundă va acoperi unde DSP-urile se află pe această piață rapidă.