Locuza
Lötkolbengott/-göttin
Also Zusammenführung passt ja auch nicht.
Es wurden schließlich keine Elemente von Pascal für Turing verwendet.
Insofern kann man Turing durchaus als ein Volta mit RT-Cores und paar anderen Differenzen ansehen.
Der RT-Core stellt auf jeden Fall eine Recheneinheit dar, welche die bounding volume hierarchy durchläuft und ebenso die Schnittpunkte mit der Geometrie berechnet.
Die Funktionalitäten sind sicherlich beschränkt, aber eben wie bei jeder Fixed-Function-Hardware.
Bezüglich der Weiterentwicklung der GPUs mag ich die Cache-Hierarchie von RDNA.
AMD hat mit der neuen Cache-Zwischenstufe die interne Skalierung praktisch in Cluster aufgeteilt.
Geometrie/Rasterizer, ein Shader-Array und ein Teil der ROPs teilen sich einen neuen L1$, welcher dann weiter geht zum L2$.
Dadurch muss ein L1$ bei aktuellen Navi GPUs nur einen lokalen Teil füttern und zum L2$ sind deutlich weniger Verbindungen nötig.
Anders sieht das bei GCN oder Turing aus, wo ein globales und massives Netzwerk über alle Recheneinheiten gezogen wird.
Bezüglich RT kann Nvidia sicherlich auch noch eine Menge machen, Imagination rühmt sich damit einen Scene Hierarchy Generator zu haben, welcher selber einen BHV erstellen kann und die Berechnung weiter beschleunigen.
Ebenso gibt es optional eine Ray-Coherence-Engine, welche versucht Rays mit ähnlicher Laufrichtung zu bündeln, damit der Speicherzugriff effizienter wird und die Caches nicht ständig getrashed werden.
AMD könnte offensichtlich noch den Durchsatz für INT32 beschleunigen und ebenso wie Volta/Turing eine parallele Ausführung von INT und FP ermöglichen.
Ebenso könnte es sich anbieten L1$ und LDS zusammen zu legen, um die Bandbreite und Latenz massiv zu verbessern und flexibler bei den Kapazitäten zu sein.
Ich bin gespannt auf RDNA2 und wie AMDs Raytracing-Lösung aussehen wird.
Es wurden schließlich keine Elemente von Pascal für Turing verwendet.
Insofern kann man Turing durchaus als ein Volta mit RT-Cores und paar anderen Differenzen ansehen.
Der RT-Core stellt auf jeden Fall eine Recheneinheit dar, welche die bounding volume hierarchy durchläuft und ebenso die Schnittpunkte mit der Geometrie berechnet.
Die Funktionalitäten sind sicherlich beschränkt, aber eben wie bei jeder Fixed-Function-Hardware.
Bezüglich der Weiterentwicklung der GPUs mag ich die Cache-Hierarchie von RDNA.
AMD hat mit der neuen Cache-Zwischenstufe die interne Skalierung praktisch in Cluster aufgeteilt.
Geometrie/Rasterizer, ein Shader-Array und ein Teil der ROPs teilen sich einen neuen L1$, welcher dann weiter geht zum L2$.
Dadurch muss ein L1$ bei aktuellen Navi GPUs nur einen lokalen Teil füttern und zum L2$ sind deutlich weniger Verbindungen nötig.
Anders sieht das bei GCN oder Turing aus, wo ein globales und massives Netzwerk über alle Recheneinheiten gezogen wird.
Bezüglich RT kann Nvidia sicherlich auch noch eine Menge machen, Imagination rühmt sich damit einen Scene Hierarchy Generator zu haben, welcher selber einen BHV erstellen kann und die Berechnung weiter beschleunigen.
Ebenso gibt es optional eine Ray-Coherence-Engine, welche versucht Rays mit ähnlicher Laufrichtung zu bündeln, damit der Speicherzugriff effizienter wird und die Caches nicht ständig getrashed werden.
AMD könnte offensichtlich noch den Durchsatz für INT32 beschleunigen und ebenso wie Volta/Turing eine parallele Ausführung von INT und FP ermöglichen.
Ebenso könnte es sich anbieten L1$ und LDS zusammen zu legen, um die Bandbreite und Latenz massiv zu verbessern und flexibler bei den Kapazitäten zu sein.
Ich bin gespannt auf RDNA2 und wie AMDs Raytracing-Lösung aussehen wird.