Akcijski pospeševalnik nevronskih omrežij na osnovi FPGA presega grafične procesorje
Dokazano je bilo kot GoogLeNet Inception-v1 CNN z uporabo osem bitne celoštevilčne ločljivosti. Dosegel je 16,8 terenskih operacij na sekundo (TOPS) in lahko na Xilinx Virtex UltraScale + XCVU9P-3 fpga sklepa nad 5.300 slik na sekundo. Modularni in prilagodljivi pristop omogoča primernost za zaznavanje predmetov in aplikacij za obdelavo videov na robu in v oblaku, je pojasnil Fawcett, pa tudi za sklepanje v podatkovnih centrih in inteligentnih kamerah.
DPU je lahko konfiguriran tako, da zagotavlja optimalne računalniške zmogljivosti za topologije nevronskih omrežij v aplikacijah strojnega učenja z uporabo vzporedne arhitekture DSP, porazdeljenega pomnilnika in ponovne nastavitve logike in povezljivosti za različne algoritme.
DPU dosega več kot 50% višjo zmogljivost kot kateri koli konkurenčni CNN in zunanje zmogljivosti GPU-jev za določen proračun moči ali stroškov, trdi družba. "Fpga je platforma in arhitektura, ki bije svetovno bitje, ki je zelo prilagodljiva za zagotavljanje prihodnosti in z AI z nižjo zamudo lahko prekaša GPU-je," je dodal Fawcett.
Družba je tudi sporočila, da sponzorira DPhil (PhD0 na univerzi Oxford za študij tehnik za izvajanje poglobljenega učenja na fpgas-u. Delo bo potekalo v sodelovanju z lastnimi raziskavami Omnitek-a v računalniških motorjih in algoritmih AI.
