Ob der einzelne Sunny Cove oder aber bis zu vier Tremonts rechnen, wird durch eine Mischung aus Hardware und Firmware sowie den Scheduler des Betriebssystems (Windows 10) gelöst. Wir haben überprüft, wie Last auf welchem Kern landet.
Windows-10-Scheduler macht, was er soll
Grundsätzlich sieht Intel vor, dass bei interaktiven und responsiven Aufgaben der SNC-Kern rechnet, etwa beim Öffnen einen Programms oder eines Tabs im Web-Browser. Bei leichter Vordergrundlast und bei Hintergrund-Threads springen hingegen die TNT-Kerne ein.
Der SNC-Kern springt durchgehend beim Starten von Anwendungen, aber regelmäßig auch beim Web-Browsing, bei Video-Konferenzen und bei Office an. Beim interaktiven Bearbeiten von Fotos und Videos läuft er dauerhaft mit über 2,5 GHz - so wie es sein soll. Sobald Raytracing via POV-Ray ansteht, wird er hingegen abgeschaltet und die vier Tremont-Kerne takten konstant mit 1,9 GHz - ebenfalls wie vorgesehen. In der Spitze sahen wir über 2,9 GHz (SNC) respektive über 2,7 GHz (TNT), was unter Berücksichtigung der C-States für die spezifizierten 3 GHz und 2,8 GHz spricht.
Interessant ist hierbei, dass die Core Rotation Policy von Windows 10 umgesetzt wird: Ein Singlethread-Workload wie Cinebench 1T wird zwischen den vier TNTs herumgereicht, nicht aber auf den SNC verlagert. Das passt zu Intels Aussage, denn Rendering ist keine interaktive Aufgabe. Wollen wir sehen, wie schnell der einzelne Sunny Cove rechnet, müssen wir den Prozess per Affinity-Mask auf den entsprechenden Kern #4 pinnen (#0 bis #3 sind die Tremonts).
Zwei unterschiedliche Mikroarchitekuren zu verwenden, hat signifikante Vorteile, erfordert allerdings einen entsprechend vorbereiteten Scheduler. Von der Hardware über die Firmware bis hin zum Betriebssystem müssen alle Stellschrauben ineinander greifen, sonst scheitert der Ansatz des heterogenen Designs. Intel und Microsoft ist es gelungen, dass Lakefield im Zusammenspiel mit Windows 10 von Beginn an alle anfallenden Lasten auf die richtigen Kerne verteilt.
Responsive Workloads wie das Starten von Anwendungen oder das Bearbeiten von Fotos erledigt der einzelne Performance-Kern. Bei längeren Aufgaben wie Raytracing-Rendering hingegen springen die vier sparsamen Atom-Kerne an, da diese bei gleicher Leistungsaufnahme eine absolute höhere Geschwindigkeit aufweisen und während der Berechnung ohnehin keine Interaktivität durch die Person vor dem Notebook gefragt ist.