Xeon Phi - Xeon Phi
Obecná informace | |
---|---|
Spuštěno | 2010 |
Přerušeno | 2020 |
Výkon | |
Max. Taktovací frekvence CPU | 1,053 GHz až 1,7 GHz |
Mezipaměti | |
Mezipaměť L1 | 32 KB na jádro |
Mezipaměť L2 | 512 kB na jádro |
Architektura a klasifikace | |
Architektura | x86-64 |
Rozšíření | |
Fyzické specifikace | |
Tranzistory | |
Jádra | |
Zásuvka | |
Produkty, modely, varianty | |
Název značky |
Xeon Phi je řada x86 manycore procesorů navržených a vyrobených společností Intel . Je určen pro použití v superpočítačích, serverech a špičkových pracovních stanicích. Jeho architektura umožňuje použití standardních programovacích jazyků a aplikačních programovacích rozhraní (API), jako je OpenMP .
Protože byl původně založen na dřívějším návrhu GPU (s kódovým označením „Larrabee“ ) od společnosti Intel, který byl zrušen v roce 2009, sdílí aplikační oblasti s GPU. Hlavní rozdíl mezi Xeon Phi a GPGPU, jako je Nvidia Tesla, je ten, že Xeon Phi s jádrem kompatibilním s x86 může s menšími úpravami spouštět software, který byl původně zaměřen na standardní procesor x86. Bylo přerušeno kvůli nedostatku poptávky a problémům Intelu s jeho 10nm uzlem.
Zpočátku ve formě přídavných karet založených na PCIe byl v červnu 2013 oznámen produkt druhé generace s kódovým označením Knights Landing . Tyto čipy druhé generace mohly být použity spíše jako samostatný procesor než jen jako doplněk Kartu.
V červnu 2013 byl superpočítač Tianhe-2 v Národním superpočítačovém centru v Guangzhou (NSCC-GZ) vyhlášen nejrychlejším superpočítačem na světě (od června 2018 je to č. 4). K dosažení 33,86 petaFLOPS používalo koprocesory Intel Xeon Phi a procesory Ivy Bridge -EP Xeon.
Produktová řada Xeon Phi přímo konkuroval Nvidia s Tesla a AMD Radeon Instinct linek hlubokého učení a GPGPU karet.
Dějiny
Krycí jméno | Technologie | Komentáře |
---|---|---|
Rytíři Ferry | 45 nm | nabízen jako karta PCIe; odvozeno z projektu Larrabee |
Rytířský koutek | 22 nm | odvozeno od P54C; jednotka pro zpracování vektorů; první zařízení, které bude oznámeno jako Xeon Phi |
Přistání rytířů | 14 nm | odvozeno od Silvermont/Airmont (Intel Atom); AVX-512 |
Rytířský mlýn | 14 nm | téměř identický s Knights Landing, ale optimalizovaný pro hluboké učení |
Knights Hill | 10 nm | zrušeno |
Pozadí
Larrabee mikroarchitektuře (ve vývoji od roku 2006) představil velmi široký (512-bit) SIMD jednotky až po x86 designu architektura na bázi procesoru, prodloužena do mezipaměti koherentní multiprocesorovém systému připojeného přes kruhový autobus do paměti; každé jádro bylo schopné čtyřcestného multithreadingu. Vzhledem k tomu, že design byl určen pro GPU i pro obecné účely, čipy Larrabee obsahovaly také specializovaný hardware pro vzorkování textur. Projekt výroby maloobchodního produktu GPU přímo z výzkumného projektu Larrabee byl ukončen v květnu 2010.
Další současný Intel výzkumný projekt zavádění x86 architektury na mnoho-vícejádrové procesory byl ‚ Single-chip Cloud Computer ‘ (prototyp představen 2009), design napodobující cloud computing počítačová datacentrum na jediném čipu s několika nezávislými jádry: prototyp návrhu zahrnuty 48 jader na čip s hardwarovou podporou pro selektivní řízení frekvence a napětí jader pro maximalizaci energetické účinnosti a integrovaná síťová síť pro mezičipové zasílání zpráv. Návrh postrádal koherentní jádra v mezipaměti a soustředil se na principy, které by umožnily návrh škálovat na mnohem více jader.
Teraflopech Research Chip (prototyp představen 2007) je experimentální 80-core čip s dvěma s plovoucí čárkou se jednotek na jádro, se provádí 96-bit VLIW architekturu místo x86. Projekt zkoumal metody intercore komunikace, správu napájení na čip a dosáhl 1,01 TFLOPS při 3,16 GHz při spotřebě 62 W energie.
Rytíři Ferry
Prototypová deska společnosti Intel s mnoha integrovanými jádry (MIC), pojmenovaná Knights Ferry , obsahující procesor s kódovým označením Aubrey Isle, byla oznámena 31. května 2010. Tento produkt byl uveden jako derivát projektu Larrabee a dalšího výzkumu společnosti Intel včetně cloudového počítače s jedním čipem .
Vývojový produkt byl nabízen jako karta PCIe s 32 jádry v pořadí na frekvenci až 1,2 GHz se čtyřmi vlákny na jádro, 2 GB paměti GDDR5 a 8 MB soudržné mezipaměti L2 (256 kB na jádro s 32 kB mezipaměti L1) a příkon ~ 300 W, postavený na 45 nm procesu. V jádru Aubrey Isle propojuje procesory s hlavní pamětí 1024bitová kruhová sběrnice (512bitová obousměrná). Výkon jedné desky překročil 750 GFLOPS. Prototypové desky podporují pouze pokyny s plovoucí desetinnou čárkou s jednoduchou přesností .
Počáteční vývojáři zahrnovali CERN , Korea Institute of Science and Technology Information (KISTI) a Leibniz Supercomputing Center . Mezi výrobce hardwaru prototypových desek patřily společnosti IBM, SGI, HP, Dell a další.
Rytířský koutek
Knights Corner produkt je vyráběn v 22 nm velikosti procesu, pomocí Intel Tri-gate technologie s více než 50 jader na čipu, a je první řada-jádra komerční produkt společnosti Intel.
V červnu 2011 společnost SGI oznámila partnerství se společností Intel, aby ve svých vysoce výkonných výpočetních produktech používala architekturu MIC. V září 2011 bylo oznámeno, že Texas Advanced Computing Center (TACC) bude používat karty Knights Corner ve svém superpočítači „Stampede“ s 10 petaFLOPS a poskytne 8 petaFLOPS výpočetního výkonu. Podle „Stampede: A Comprehensive Petascale Computing Environment“ budou „MIC druhé generace Intel (Knights Landing) přidány, až budou k dispozici, což zvýší celkový špičkový výkon Stampede na minimálně 15 PetaFLOPS“.
Dne 15. listopadu 2011 společnost Intel ukázala ranou křemíkovou verzi procesoru Knights Corner.
Dne 5. června 2012 společnost Intel vydala open source software a dokumentaci týkající se Knights Corner.
Dne 18. června 2012 společnost Intel na mezinárodní superpočítačové konferenci v Hamburku v roce 2012 oznámila, že Xeon Phi bude obchodní značka používaná pro všechny produkty na základě jejich architektury Many Integrated Core. V červnu 2012 Cray oznámil, že bude nabízet 22 nm čipy 'Knight's Corner' (značené jako 'Xeon Phi') jako koprocesor ve svých systémech 'Cascade'.
V červnu 2012 ScaleMP oznámil aktualizaci virtualizace, která umožňuje Xeon Phi jako transparentní rozšíření procesoru a umožňuje spouštění staršího kódu MMX / SSE bez změn kódu. Důležitou součástí jádra koprocesoru Intel Xeon Phi je jeho jednotka pro zpracování vektorů (VPU). VPU obsahuje novou 512bitovou sadu instrukcí SIMD, oficiálně známou jako Intel Initial Many Core Instructions (Intel IMCI). VPU tedy může provést 16 operací s jednou přesností (SP) nebo 8 operací s dvojitou přesností (DP) za cyklus. VPU také podporuje pokyny FMA (Fused Multiply-Add), a proto může provádět 32 SP nebo 16 DP operací s pohyblivou řádovou čárkou za cyklus. Poskytuje také podporu celých čísel. VPU také obsahuje rozšířenou matematickou jednotku (EMU), která může provádět operace, jako je reciproční, odmocnina a logaritmus, což umožňuje provádění těchto operací vektorovým způsobem s velkou šířkou pásma. EMU funguje na základě výpočtu polynomických aproximací těchto funkcí.
Dne 12. listopadu 2012 společnost Intel oznámila dvě rodiny koprocesorů Xeon Phi využívající velikost procesu 22 nm: Xeon Phi 3100 a Xeon Phi 5110P. Xeon Phi 3100 bude schopen více než 1 teraFLOPS instrukcí s plovoucí desetinnou čárkou s dvojitou přesností a šířkou pásma paměti 240 GB/s při 300 W. Xeon Phi 5110P bude schopen 1,01 teraFLOPS instrukcí s dvojitou přesností s plovoucí desetinnou čárkou s Šířka pásma paměti 320 GB/s při 225 W. Xeon Phi 7120P bude schopen 1,2 teraFLOPS instrukcí s dvojitou přesností s plovoucí desetinnou čárkou s šířkou pásma paměti 352 GB/s při 300 W.
Dne 17. června 2013 byl superpočítač Tianhe-2 vyhlášen společností TOP500 jako nejrychlejší na světě. Tianhe-2 použil procesory Intel Ivy Bridge Xeon a Xeon Phi k dosažení 33,86 petaFLOPS. Bylo to nejrychlejší na seznamu za dva a půl roku, naposledy v listopadu 2015.
Návrh a programování
Jádra Knights Corner vycházejí z upravené verze designu P54C , použité v původním Pentiu. Základem architektury Intel MIC je využít dědictví x86 vytvořením architektury více procesorů kompatibilní s x86, která může využívat stávající softwarové nástroje pro paralelizaci. Mezi programovací nástroje patří OpenMP , OpenCL , Cilk / Cilk Plus a specializované verze knihoven Intel Fortran, C ++ a math.
Mezi konstrukční prvky převzaté z projektu Larrabee patří x86 ISA, 4cestný SMT na jádro, 512bitové jednotky SIMD, instrukční mezipaměť 32 kB L1, datová mezipaměť 32 kB L1, soudržná mezipaměť L2 (512 kB na jádro) a ultraširoký kruhová sběrnice spojující procesory a paměť.
Pokyny 512bitové SIMD Knights Corner sdílejí mnoho vnitřních funkcí s rozšířením AVX-512. Dokumentace instrukční sady je k dispozici od společnosti Intel pod názvem rozšíření KNC.
- Modely řady Xeon Phi
X100
název | Sériové číslo |
Jádra ( vlákna @ 4x jádro) |
Hodiny (MHz) | Mezipaměť L2 |
Paměť GDDR5 ECC | Peak DP Compute (GFLOPS) |
TDP (W) |
Chladicí systém |
Form Factor | Vydáno | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Základna | Turbo | Množství | Kanály |
ČB GB/s |
|||||||||
Xeon Phi 3110X | SE3110X | 61 (244) | 1053 | - | 30,5 MB | 6 GB | 12 | 240 | 1028 | 300 | Holé prkno | Karta PCIe 2.0 x16 | Listopadu 2012 |
8 GB | 16 | 320 | |||||||||||
Xeon Phi 3120A | SC3120A | 57 (228) | 1100 | - | 28,5 MB | 6 GB | 12 | 240 | 1003 | 300 | Ventilátor/chladič | 17. června 2013 | |
Xeon Phi 3120P | SC3120P | 57 (228) | 1100 | - | 28,5 MB | 6 GB | 12 | 240 | 1003 | 300 | Pasivní chladič | 17. června 2013 | |
Xeon Phi 31S1P | BC31S1P | 57 (228) | 1100 | - | 28,5 MB | 8 GB | 16 | 320 | 1003 | 270 | Pasivní chladič | 17. června 2013 | |
Xeon Phi 5110P | SC5110P | 60 (240) | 1053 | - | 30,0 MB | 8 GB | 16 | 320 | 1011 | 225 | Pasivní chladič | 12. listopadu 2012 | |
Xeon Phi 5120D | SC5120D | 60 (240) | 1053 | - | 30,0 MB | 8 GB | 16 | 352 | 1011 | 245 | Holé prkno | SFF 230pinová karta | 17. června 2013 |
BC5120D | |||||||||||||
Xeon Phi SE10P | SE10P | 61 (244) | 1100 | - | 30,5 MB | 8 GB | 16 | 352 | 1074 | 300 | Pasivní chladič | Karta PCIe 2.0 x16 | 12. listopadu 2012 |
Xeon Phi SE10X | SE10X | 61 (244) | 1100 | - | 30,5 MB | 8 GB | 16 | 352 | 1074 | 300 | Holé prkno | 12. listopadu 2012 | |
Xeon Phi 7110P | SC7110P | 61 (244) | 1100 | 1250 | 30,5 MB | 16 GB | 16 | 352 | 1220 | 300 | Pasivní chladič | ??? | |
Xeon Phi 7110X | SC7110X | 61 (244) | 1250 | ??? | 30,5 MB | 16 GB | 16 | 352 | 1220 | 300 | Holé prkno | ??? | |
Xeon Phi 7120A | SC7120A | 61 (244) | 1238 | 1333 | 30,5 MB | 16 GB | 16 | 352 | 1208 | 300 | Ventilátor/chladič | 06.04.2014 | |
Xeon Phi 7120D | SC7120D | 61 (244) | 1238 | 1333 | 30,5 MB | 16 GB | 16 | 352 | 1208 | 270 | Holé prkno | SFF 230pinová karta | Březen ??, 2014 |
Xeon Phi 7120P | SC7120P | 61 (244) | 1238 | 1333 | 30,5 MB | 16 GB | 16 | 352 | 1208 | 300 | Pasivní chladič | Karta PCIe 2.0 x16 | 17. června 2013 |
Xeon Phi 7120X | SC7120X | 61 (244) | 1238 | 1333 | 30,5 MB | 16 GB | 16 | 352 | 1208 | 300 | Holé prkno | 17. června 2013 |
Přistání rytířů
Kódový název produktu druhé generace architektury MIC od společnosti Intel. Společnost Intel oficiálně poprvé odhalila podrobnosti o svých produktech druhé generace Intel Xeon Phi dne 17. června 2013. Intel uvedl, že příští generace produktů založených na architektuře Intel MIC Architecture bude k dispozici ve dvou formách, jako koprocesor nebo hostitelský procesor (CPU), a musí být vyroben s použitím Intel 14 nm výrobní technologie. Produkty Knights Landing budou zahrnovat integrovanou paměť v balíčku pro výrazně vyšší šířku pásma paměti.
Knights Landing obsahuje až 72 jader Airmont (Atom) se čtyřmi vlákny na jádro, využívající patici LGA 3647 podporující až 384 GB „vzdálené“ paměti DDR4 2133 RAM a 8–16 GB skládané „blízké“ 3D MCDRAM , verze Hybridní paměťová kostka . Každé jádro má dvě 512bitové vektorové jednotky a podporuje instrukce AVX-512 SIMD, konkrétně Intel AVX-512 Foundational Instructions (AVX-512F) s Intel AVX-512 Conflict Detection Instructions (AVX-512CD), Intel AVX-512 Exponential a Reciproční instrukce (AVX-512ER) a Intel AVX-512 Prefetch Instructions (AVX-512PF). Podpora pro IMCI byla odebrána ve prospěch AVX-512.
National Energy Research Scientific Computing Center oznámila, že fáze 2 svého nejnovějšího superpočítačového systému "Cori" by používal Knights Landing Xeon Phi koprocesory.
Dne 20. června 2016 společnost Intel uvedla na trh řadu produktů Intel Xeon Phi x200 založenou na architektuře Knights Landing, přičemž zdůraznila její použitelnost nejen na tradiční úlohy simulace, ale také na strojové učení . Modelová řada oznámená při spuštění zahrnovala pouze Xeon Phi zaváděcího formátu, ale dvě její verze: standardní procesory a procesory s integrovanou architekturou Intel Omni-Path . Ten je označen příponou F v čísle modelu. Očekává se, že integrovaná tkanina poskytne lepší latenci za nižší cenu než diskrétní vysoce výkonné síťové karty.
Dne 14. listopadu 2016 obsahoval 48. seznam TOP500 10 systémů využívajících platformy Knights Landing.
PCIe založený koprocesor varianta Rytířském přistání nebyl nikdy určen pro širokou trhu a byla ukončena v srpnu 2017. To zahrnovalo 7220A, 7240P a 7220P koprocesor karty.
Intel oznámil, že v létě 2018 ukončují hru Knights Landing.
- Modely
Všechny modely mohou zvýšit své špičkové rychlosti a přidat 200 MHz k základní frekvenci, pokud běží pouze jedno nebo dvě jádra. Při běhu ze tří na maximální počet jader mohou čipy posílit pouze 100 MHz nad základní frekvenci. Všechny čipy používají kód AVX na frekvenci snížené o 200 MHz.
Řada Xeon Phi 7200 |
sSpec číslo |
Jádra (vlákna) |
Hodiny (MHz) | Mezipaměť L2 |
Paměť MCDRAM | Paměť DDR4 | Špičkový výpočet DP |
TDP (W) |
Zásuvka | Datum vydání | Číslo dílu | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Základna | Turbo | Množství | ČB | Kapacita | ČB | |||||||||
Xeon Phi 7210 | SR2ME (B0) | 64 (256) | 1300 | 1500 | 32 MB | 16 GB | 400+ GB/s | 384 GB | 102,4 GB/s | 2662 GFLOPS |
215 | SVLCLGA3647 | 20. června 2016 | HJ8066702859300 |
SR2X4 (B0) | ||||||||||||||
Xeon Phi 7210F | SR2X5 (B0) | 230 | HJ8066702975000 | |||||||||||
Xeon Phi 7230 | SR2MF (B0) | 215 | HJ8066702859400 | |||||||||||
SR2X3 (B0) | ||||||||||||||
Xeon Phi 7230F | SR2X2 (B0) | 230 | HJ8066702269002 | |||||||||||
Xeon Phi 7250 | SR2MD (B0) | 68 (272) | 1400 | 1600 | 34 MB | 3046 GFLOPS |
215 | HJ8066702859200 | ||||||
SR2X1 (B0) | ||||||||||||||
Xeon Phi 7250F | SR2X0 (B0) | 230 | HJ8066702268900 | |||||||||||
Xeon Phi 7290 | SR2WY (B0) | 72 (288) | 1500 | 1700 | 36 MB | 3456 GFLOPS |
245 | HJ8066702974700 | ||||||
Xeon Phi 7290F | SR2WZ (B0) | 260 | HJ8066702975200 |
Knights Hill
Knights Hill bylo kódové označení architektury MIC třetí generace, pro kterou Intel oznámil první detaily na SC14. Měl být vyroben 10 nm procesem.
Očekávalo se, že Knights Hill bude použit v superpočítači amerického ministerstva energetiky Aurora , který bude nasazen v Národní laboratoři Argonne . Aurora však měla zpoždění ve prospěch použití „pokročilé architektury“ se zaměřením na strojové učení.
V roce 2017 společnost Intel oznámila, že Knights Hill byla zrušena ve prospěch jiné architektury postavené od základů, aby v budoucnu umožnila výpočet Exascale . Tato nová architektura se nyní očekává v letech 2020–2021.
Rytířský mlýn
Knights Mill je kódové označení společnosti Intel pro produkt Xeon Phi specializovaný na hloubkové učení , původně vydaný v prosinci 2017. Téměř identický ve specifikacích jako Knights Landing, Knights Mill obsahuje optimalizace pro lepší využití instrukcí AVX-512 a umožňuje čtyřsměrné hypervlákno . Zvýšil se výkon s plovoucí desetinnou čárkou s jednoduchou a proměnnou přesností na úkor výkonu s plovoucí desetinnou čárkou s dvojitou přesností.
- Modely
Řada Xeon Phi 72x5 |
sSpec číslo | Jádra (vlákna) |
Hodiny (MHz) | Mezipaměť L2 |
Paměť MCDRAM | Paměť DDR4 | Špičkový výpočet DP |
TDP (W) |
Zásuvka | Datum vydání | Číslo dílu | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Základna | Turbo | Množství | ČB | Kapacita | ČB | |||||||||
Xeon Phi 7235 | SR3VF (A0) | 64 (256) | 1300 | 1400 | 32 MB | 16 GB | 400+ GB/s | 384 GB | 102,4 GB/s | TBA | 250 | SVLCLGA3647 | 4. čtvrtletí 2017 | HJ8068303823900 |
Xeon Phi 7285 | SR3VE (A0) | 68 (272) | 1300 | 1400 | 34 MB | 115,2 GB/s | TBA | 250 | HJ8068303823800 | |||||
Xeon Phi 7295 | SR3VD (A0) | 72 (288) | 1500 | 1600 | 36 MB | 115,2 GB/s | TBA | 320 | HJ8068303823700 |
Programování
Vědci provedli empirickou studii výkonu a programovatelnosti, ve které autoři tvrdí, že dosažení vysokého výkonu s Xeon Phi stále potřebuje pomoc programátorů a že pouhé spoléhání se na kompilátory s tradičními programovacími modely je stále daleko od reality. Výzkum v různých oblastech, jako jsou biologické vědy, a hluboké učení však prokázaly, že využíváním paralelnosti vláken a SIMD Xeon Phi se dosáhne významného zrychlení.
Konkurenti
- Nvidia Tesla , přímý konkurent na trhu HPC
- AMD Radeon Pro a AMD Radeon Instinct jsou přímými konkurenty na trhu HPC
Viz také
- Texas Advanced Computing Center - superpočítač „Stampede“ obsahuje čipy Xeon Phi. Stampede je schopen 10 petaFLOPS.
- AVX-512
- Buňka (mikroprocesor)
- Intel Tera-Scale
- Masivně paralelní
- Xeon
Reference
externí odkazy
- Stránky Intel: Procesory Intel Xeon Phi