Intel: Erster Teraflop-Prozessor vorgestellt

Der Cayman hat auch eine höhere DP-Rate als der Fermi mit 675 GFLOP/S. Niedriger zwar als Knights Corner, aber nicht weltbewegend. Die Nachfolger (Southern Islands/Kepler) werden sicher noch eine ganze Ecke schneller.
Das ist wiederum wahr. Die Anzahl der GleitkommaOPs pro Sekunde ist eh ein realitätsferner Wert. Meine GTX 560 Ti rendert (nicht Spiele!) auch schneller als eine HD 6970, zumindest in manchen Applikationen. Und meist ist die GTX 580 an der Spitze.
Wie er sich bei Anwendungen schlägt, das wird sich zeigen.
EDIT:
interessant finde ich, dass Intel den Knight's Corner nun in den CPU-Sockel schickt. Wahrscheinlich will Intel nun einen Chip "erfinden" der die Vorteile einer GPU mit denen einer CPU verbindet - der also sowohl ein paralleles Rechenwerk wie eine GPU (50 Kerne sprechen für sich...) als auch ein sequenzielles Rechenwerk wie eine CPU (samt massig Cache + RAM) ist.
Man, der müsste in manchen Anwendungen Abgehen wie die Sau... ich bin gespannt!
Hoffentlich frisst er nicht zu viel Strom. Obwohl, das dürfte wohl bei dem wahrscheinlich horroden Anschaffungspreis egal sein.
 
Zuletzt bearbeitet:
Hmm... eine Radeon 6900 bzw. der Cayman-Chip kann 2,7 TFLOPS ;) Bei Grafikkarten ist dieser Wert ein alter Hut.

Gleich 2 Fehler auf einmal. Das sind Sp-FLops. MIC schafft das aber in DP. Da hat die 6900er nur noch 1/4, also unter 700 GFLops.

So und nun noch der zweite Fehler. Du beziehst dich auf die theoretische Rechenleistung. Hier ist aber die bei einer realen Anwendung, nämlich DGEMM. Also einer DP-Matrix-Matrix-Multiplikation. Das schaffen die aktuellen GPUs nicht mal 400 GFLops.

Das wird eine ganz harte nuss für AMD und nvidia.
 
Interessant:) und du hast recht damit!

Danke, so war's geplant! ;)
Hab das auch schon beim "Selbstversuch" gemacht. Wenig Caching → GPU seeehr schnell; (sehr) viel Caching → GPU seeeehr langsam. Man muss sich nur mal die Kerne und den Speicherausbau anschauen. Den GPUs fehlt sogar der L3-Cache. Eine GTX 580 mit über 400 Kernen hat nicht mal 1MiB Cache und einen "RAM" mit nur 1,5 GiB Kapazität. Ein Core i7 2600k hingegen hat ganze 8MiB L3-Cache, also insg. circa 10MiB Cache, dazu noch maximal satte 16GiB Speicher... Die GPUs sind schlichtweg nicht zum Hardcorerechnen gemacht worden. Interessanter wäre es daher, den Knight's Corner mit einer Quadro FX zu vergleichen (falls so die aktuellen Workstationkarten heißen...). Da passt dann auch der Preis wieder in etwa. Dass die normalen Radeon/Geforce-Karten bei den DP-Berechnungen kein Land mehr sehen, ist ja mehr wie logisch. Welcher User nutzt seine HD6970/ GTX 570 schon zum Rendern? Die sind zum Zocken gemacht worden, und zum Zocken braucht man keine DP-Berechnungen.

Gleich 2 Fehler auf einmal. Das sind Sp-FLops. MIC schafft das aber in DP. Da hat die 6900er nur noch 1/4, also unter 700 GFLops.

So und nun noch der zweite Fehler. Du beziehst dich auf die theoretische Rechenleistung. Hier ist aber die bei einer realen Anwendung, nämlich DGEMM. Also einer DP-Matrix-Matrix-Multiplikation. Das schaffen die aktuellen GPUs nicht mal 400 GFLops.

Das wird eine ganz harte nuss für AMD und nvidia.

Kommt drauf an. In Computing-Hinsicht wird der Knight's Corner die aktuellen GPUs wohl wirklich in Grund und Boden rechnen, aber ich denke, dass er dafür bei SP-Berechnungen ein absolut läppischer Gegner für die Southern Islands oder die Keplers wird. Man muss halt wissen, was man möchte: eine GPGPU oder eine hochgezüchtete CPU.
 
Hier sprechen wohl die Wahren Nerds und Geeks den ich verstehe garnicht worüber ihr redet Matrix-Matrix-Multiplikation Tflops Exaflops. Was zum Teufel ist den damit gemeint ?.

Zum Thema. Ich finde es sehr Interesannt was Intel da macht ich weis zwar nicht soviel über das thema würde es aber sehr gerne Lehrenen.


Edit: Bin Legahsteniker.
 
vor allem der preis....

womit wird der den gekühlt super megahelams mit 10cm2 großen kühlerboden?
der chip muss ja riesig sein.

Soweit ich Weiß Bestehen die Einzelnen Cores leicht über arbeiteten Pentium Cores (!!!)

Larrabee (GPU)

Gut da geht es zwar um larrabee aber das sollte irrelevant sein

Was in der einleitenden Newa auch fehlt ist die Tatsache das: "Teraflop Double-Precision-Fließkomma-Rechenleistung"

Das lässt dann den vorsprung der Graka Schnelzn b.z weg brechen


Ach ja ind Bild

http://media.bestofmicro.com/H/I/315558/original/KnightsCorner.jpg
 
Danke, so war's geplant! ;)
Hab das auch schon beim "Selbstversuch" gemacht. Wenig Caching → GPU seeehr schnell; (sehr) viel Caching → GPU seeeehr langsam. Man muss sich nur mal die Kerne und den Speicherausbau anschauen. Den GPUs fehlt sogar der L3-Cache. Eine GTX 580 mit über 400 Kernen hat nicht mal 1MiB Cache und einen "RAM" mit nur 1,5 GiB Kapazität. Ein Core i7 2600k hingegen hat ganze 8MiB L3-Cache, also insg. circa 10MiB Cache, dazu noch maximal satte 16GiB Speicher...
richtig, die gpus haben wenig Cache, aber deswegen sind sie Nicht zwingend langsam.

dein "Selbstversuch" interessiert mich btw. Was haste denn gemacht?

was verstehst du denn unter wenig/viel caching?

damit je GPU Leistung bringt, muss eher die worksize recht klein sein, also die datenlokalität hoch. Zudem müssen die Daten oft genug reused werden.

Die GPUs sind schlichtweg nicht zum Hardcorerechnen gemacht worden.
was halt einfach falsch ist

Interessanter wäre es daher, den Knight's Corner mit einer Quadro FX zu vergleichen (falls so die aktuellen Workstationkarten heißen...). Da passt dann auch der Preis wieder in etwa. Dass die normalen Radeon/Geforce-Karten bei den DP-Berechnungen kein Land mehr sehen, ist ja mehr wie logisch. Welcher User nutzt seine HD6970/ GTX 570 schon zum Rendern? Die sind zum Zocken gemacht worden, und zum Zocken braucht man keine DP-Berechnungen.
du weist schon das die nvidia-Karten beschnitten sind was CP-Leistung anbelangt, aber die AMD-Karten nicht!
Daher steckt jede Radeon auch die GeForce in die Tasche. 500vs190 DP-GFlops Ca.

Kommt drauf an. In Computing-Hinsicht wird der Knight's Corner die aktuellen GPUs wohl wirklich in Grund und Boden rechnen, aber ich denke, dass er dafür bei SP-Berechnungen ein absolut läppischer Gegner für die Southern Islands oder die Keplers wird. Man muss halt wissen, was man möchte: eine GPGPU oder eine hochgezüchtete CPU.
dir ist schon klar, das MIC genau wie die nVidias je 2:1 SP:DP-Ratio hat?Wenn MIC die nVidia in DP schlägt, dann auch in SP. Die GCN Radeons werden wohl sehr sehr wahrscheinlich auch ne 2:1 Ratio bekommen. Nur bei den VLIW-Radeons besteht die Möglichkeit, dass die in DP unterliegen aber in SP gewinnen.

man man man, warum immer diese Halbwahrheiten und schlimmer?

warum informiert msn sich nicht, bevor man so Sachen vom Stapel lässt?
 
richtig, die gpus haben wenig Cache, aber deswegen sind sie Nicht zwingend langsam.

dein "Selbstversuch" interessiert mich btw. Was haste denn gemacht?

was verstehst du denn unter wenig/viel caching?
Ich hab meine GPU und meine CPU in einer recht komplexen Szene raytracen lassen, einmal mit geringer Strahlentiefe (ca. 12) und ein mal mit sehr hoher (1024+).
Und je höher die Strahlentiefe, desto mehr muss eben gecached werden, denn ein Strahl wird ja hin- und hergeworfen und die Zwischeninformationen, die Ausrichtung und "Farbgebung" des Strahls sowie dessen "Energie" (für die globale Beleuchtung) müssen ja mitgetragen werden. Daher ist kaum reusing vorhanden und die 384 Cores (bei mir), die ständig Informationen puffern müssen, müssen eben massig auslagern. Bei hoher Strahlentiefe ist der Renderer auch häufig abgeflogen, ich gehe davon aus, das Cache und VRAM übergelaufen sind, kann das aber nicht sicher sagen.
Naja, ich hab dann schließlich herausgefunden, dass die GPU bei steigender "Strahlentiefe" immer langsamer wird und schließlich von der CPU überholt wird, die sowas schlicht besser kann.

damit je GPU Leistung bringt, muss eher die worksize recht klein sein, also die datenlokalität hoch. Zudem müssen die Daten oft genug reused werden.
→Siehe oben. Das hab ich gemeint.

was halt einfach falsch ist
Das zeigt, dass du nicht verstanden hast, was ich gemeint habe =) (sorry an dieser Stelle für die holprige Formulierung)
Klar, ein jeder Chip ist fürs Rechnen gemacht worden, okay, aber mit "Hardcorerechnen" ist mir einfach kein besserer Begriff eingefallen. Gemeint ist sowas wie hochkomplexe Simulationen und weiß der Geier was. Ich hoffe du verstehst, was ich meine.

du weist schon das die nvidia-Karten beschnitten sind was CP-Leistung anbelangt, aber die AMD-Karten nicht!
Daher steckt jede Radeon auch die GeForce in die Tasche. 500vs190 DP-GFlops Ca.
Nein, wusste ich nicht. Hatte gestern auch keine Lust mehr, das nachzuschlagen, daher verzeih mir meine Unwissenheit :P
Meine Vermutung war eher:
Nvidia → Weltmarktführer bei Workstationkarten → muss wohl schneller sein als AMD.

dir ist schon klar, das MIC genau wie die nVidias je 2:1 SP:DP-Ratio hat?Wenn MIC die nVidia in DP schlägt, dann auch in SP. Die GCN Radeons werden wohl sehr sehr wahrscheinlich auch ne 2:1 Ratio bekommen. Nur bei den VLIW-Radeons besteht die Möglichkeit, dass die in DP unterliegen aber in SP gewinnen.

man man man, warum immer diese Halbwahrheiten und schlimmer?

warum informiert msn sich nicht, bevor man so Sachen vom Stapel lässt?
→ Siehe oben. Mein Post stützt sich teilweise auf Vermutungen (Signalwörter: "Ich denke, dass" ;-))
Daher erneut sorry. Aber danke, dass du dir die Mühe gemacht hast, meinen Post auseinanderzunehmen :)
gRU?; cAPS
 
Zuletzt bearbeitet:
dein Problem mit dem raytracing ist einzig und allein die geschossene datenlokalität. Überleg dir einen Algorithmus bei dem diese erhöht wird, dann steigt deine GPU-Performance massiv an.
 
dein Problem mit dem raytracing ist einzig und allein die geschossene datenlokalität. Überleg dir einen Algorithmus bei dem diese erhöht wird, dann steigt deine GPU-Performance massiv an.
Hmm... alles klar. Ich nutze meine GPU eh überwiegend zum RTen, daher hab ich gedacht, dass so ein Vergleich gar nicht schlecht wäre.
Danke nochmal,
gRU?; cAPS
 
du musst aber immer die Eigenheiten einer Architektur berücksichtigen. Nur weil etwas bei A gut funktioniert, muss es nicht bei B gut sein.

sehs einfach mal so, die GPU ist ein LKW und die CPU ein Sportwagen. Für das eine ist das eine gut, für das andere das andere.
 
Zurück