Haswell generacija predstavlja tock korak u Intel-ovom planu razvoja, što znači unapređenje arhitekture, uz zadržavanje postojećeg proizvodnog procesa. Upravo zbog toga se od Haswell procesora očekivao malo veći skok performansi nego što je to bilo kod Sandy - Ivy Bridge tranzicije. Očekivanja su pomalo splasnula kada je Intel prošle godine zvanično predstavio neke detalje Haswell arhitekture. Sada je procesor konačno stigao na test, pa ćemo oprobati realne domene nove generacije.
Unutrašnje promene
Najveći deo Haswell jezgra je "nasleđe" Ivy Bridge jezgra, uz više vrsta optimizacije. Osnovna CPU struktura jezgra je ostala ista, a to važi i za izvršni pipeline, koji i dalje ima maksimalno 19 koraka. Proizvodni proces je ostao isti, dakle 22 nm, sa upotrebom 3D (Tri-Gate) tranzistorske tehnologije, koju Intel već izvesno vreme veoma uspešno koristi. Sam Tri-Gate sistem predstavlja drugačiji način "pakovanja" tranzistora - umesto po istoj liniji i na istoj ravni (planarno), novi Tri-Gate sistem ima "3D peraje" sa tri strane umesto samo jedne. Takav pristup omogućava da tranzistor većom površinom kontroliše protok struje, čime se dobijaju bolje performanse pri promeni stanja, uz manju potrošnju energije i manje "curenja" napona. Uvođenje Tri-Gate tranzistora je bilo neophodno jer se klasičnim 22 nm proizvodnim procesom ne bi moglo spakovati toliko tranzistora na malom prostoru, a pri tome očuvati njihova efikasnost. Primena Tri-Gate tehnologije omogućava Intel-u da uštedi u proizvodnji, ali i omogućava dalji razvoj 22 nm proizvodnog procesa koji se koristi kod Haswell jezgra.
Najveći skok performansi obezbeđen je povećanjem efikasnosti paralelne obrade podataka, odnosno bržem istovremenom obrađivanju više mikroinstrukcija. Dodate su dve nove izvršne jedinice i dva izvršna porta, koji opet imaju dodatne sub-jedinice za obradu instrukcija, proračune grananja i adresiranje. Tako su bolje iskorišćene glavne četiri ALU jedinice koje sada imaju mogućnost bržeg izvršavanja klasičnog programskog koda, jer dekoder jedinice sada mogu da isporuče instrukcije na izvršavanje mnogo efikasnije nego ranije. Te modifikacije čine i sam HyperThreading efikasnijim, što na kraju utiče na finalne performanse.
Uz keš je lakše
| (kliknite za veću sliku) |
Drugi deo unapređenja u arhitekturi odnosi se na keš memoriju. Koncepcija je i dalje ista: L1, L2 i L3 keš su istog kapaciteta kao i kod Ivy Bridge procesora, ali je promenjena propusna moć pri pristupanju keš memoriji. Tako sada Haswell ima duplo veći load (povećan sa 32 na 64 bajta po ciklusu) i store bandwidth (povećan sa 16 na 32 bajta po ciklusu). Ovo važi za L1 keš, ali je i propusna moć između L1 i L2 keša duplirana, sa 32 na 64 bajta po CPU ciklusu. Na kraju, znatno je povećan kapacitet L2 TLB-a (Translation Lookaside Buffer) koji služi za beleženje i predviđanje grananja instrukcija - veći kapacitet uvek znači bolje performanse kroz bolje predviđanje grananja i smanjivanje gubitaka u slučaju pogrešne predikcije, ako je instrukcija već daleko poodmakla u pipeline-u. Sve u svemu, Haswell L2 TLB je sada četiri puta veći, uz dupliranu asocijativnost. S povećanjem L2 TLB bafera, tu je i generalno povećanje mogućnosti branch prediction jedinice, koja sada gleda dalje unapred i ima malo povećani kapacitet za beleženje i planiranje redosleda izvršavanja.
Haswell nije unapredio L3 keš. Kapacitet L3 keša zavisi direktno od broja aktivnih jezgara u procesoru, njegova interna struktura je ostala ista. Naravno, Ring BUS rešenje je i dalje u opticaju, s tim što je i njegova propusna moć nešto povećana u odnosu na Ivy Bridge. Sva ova unapređenja su relativno sitna, ali su i jedina zadužena za povećanje performansi Haswell jezgra. Intel je najavio performanse bolje za desetak procenata u odnosu na Ivy Bridge, što ne bismo nazvali tock povećanjem na kakvo smo navikli, ali je realnost na tržištu takva da Intel i nema razloga da u ovom momentu juri neki značajniji skok u brzini.
Haswell procesori donose i nov set instrukcija (AVX2, FMA3), koji ubrzava algoritme koji se prvenstveno koriste kod video i fajl kompresije. AVX instrukcije su debitovale sa Sandy Bridge jezgrom, ali je sada duplirana maksimalna teorijska brzina obrade po jednom CPU ciklusu. Tako je brzina računanja kada se koriste AVX2 i FMA3 instrukcije impresivna, a i sam Intel ove mogućnosti veoma glasno ističe. Da bi se ovo iskoristilo prvo treba optimizovati softver, ali biće i toga - bitno da se ove instrukcije mogu koristiti u raznim oblastima, što obuhvata obradu audio-podataka u vidu DSP- izvršavanje određenih instrukcija kroz OpenCL API.
Kad već opšte performanse nisu skočile, dobro je da će se nova generacija procesora "osetiti" barem u specifičnim primenama. Interesantno je napomenuti da je Haswell jezgro već sada spremno za uvođenje 512-bitnih SIMD instrukcija, jer Haswell ima dva 256-bitna floating point porta. Ovo je već veoma dobra priprema za dalji razvoj AVX instrukcija koje su se pokazale veoma efikasnim kada se primene u adekvatno optimizovanom softveru.
Energetski efikasniji
| (kliknite za veću sliku) |
Drugi deo priče o modifikacijama Haswell jezgra odnosi se na optimizaciju potrošnje energije; Intel kaže da je poboljšanje energetske efikasnosti bilo glavni cilj tokom razvoja Haswell jezgra, dok su performanse bile nekako u drugom planu. Razlog za to se krije u činjenici da Intel želi sve veći udeo u mobilnom tržištu, gde su ARM procesori već dugo dominantni. Kako je Haswell jezgro dizajnirano tako da bude veoma modularno, realno je očekivati da ćemo Haswell brzo videti u raznim mobilnim uređajima.
Jedan od sistema za smanjenje potrošnje energije je mogućnost da jezgra, L3 keš memorije i integrisani GPU rade na različitim frekvencijama, odnosno da se CPU delovi koji se ne koriste efikasno isključuju. Delovi jezgra su optimizovani tako da troše manje energije, što se pre svega odnosi na segment procesora koji komunicira sa čipsetom. Intel je dosta vremena posvetio i čipsetu, pa je proizvođačima ploča dao smernice kako bi naponska jedinica na ploči dala najefikasnije rezultate. C7 mod je dodatno unapređen tako da brže koriguje radni takt i napon, a sve to uz što manju potrošnju. Iz očiglednih razloga: manja potrošnja znači i dužu autonomiju baterije, što je od esencijalnog značaja za sve moguće mobilne uređaje.
CPU performanse možda i nisu mnogo porasle, ali je kod GPU dela priče bitno drugačija - Intel i dalje kaska za konkurencijom u oblasti integrisanih grafičkih adaptera, pa je grafički segment Haswell procesora doživeo veće korekcije. Zbog modularne arhitekture, Intel je bio u mogućnosti da unapređenjem efikasnosti grafičkog jezgra, uz dodavanje novih jedinica, duplira integrisane GPU performanse. Tako najjača GPU varijanta (GT3) ima gotovo sve duplo u odnosu na Ivy Bridge, pa je jasno odakle bolje performanse dolaze. Dodata je podrška za sve aktuelne API standarde, pa Haswell GPU podržava DirectX 11.1, OpenCL 1.2 i OpenGL 4.0. Optimizacija GPU jedinica obuhvatila je i smanjenje potrošnje energije kako bi kompletan procesor bio što nežniji prema baterijama mobilnih računara.
Za detaljni test Core i7 4770K procesora i tabelu karakteristika, pogledajte PC#201.
|