AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Hat Kaveri überhaupt L3 Cache ? soweit ich weiss hatten doch die Apus immer garkeinen L3 Cache, nur so war überhaupt möglich den Grafikteil unterzubringen.
Nein hat Kaveri nicht.
Eine gemeinsame Cache-Stufe wäre aber schon cool, Intel hat es seit Sandy-Bridge.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Das bedeuetet also auf gut Deutsch, dass sich AMD selber ins Bein schießen würde, wenn man den Grafikteil der APUs weiter aufbohren würde? Sprich man würde den eigenen Einsteiger-dGPUs einen Teil des Marktes abgraben? Viele würden sich dann also überlegen: "Wozu sich noch zusätzlich eine R7 270 holen, wenn die APU schon so schnell ist?".
Und wo ist das Problem?

Wenn man den Kunden von einem eigenen zum anderen eigenen Produkt verschiebt ist es egal, so lange die Marge nicht schlechter ist.

Man hat eher einen Vorteil sogar, da der Kunde dann immer auch ne quasi ne CPU hat. Wenn er ne dGPU hat, kauft er sich oft ne Intel CPU. Davon hat man gar nichts ;)

Zudem setzt man die Konkurrenz im Sinne von nVidia unter druck, was man machen muss, sonst macht es Intel. Man hat also gar keine Wahl als die iGPUs in nächster Zeit massiv auf zu pumpen.

die ganze Low-End GPUs sind schon heute Geschichte, und Midrange sind dann als nächstes dran. Deswegen ist für nVidia ja auch Tegra so wichtig. dGPUs sind auf lange Sicht einfach tot.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Wenn man die Dinger aber auch in den Server-Markt drücken/bringen kann, dann rentiert es sich wieder.

Im Server-Markt brauchst du nicht "eine" große iGPU + große CPU + großes SI. Da brauchst du nur ein ausgeglichenes Verhältnis, einen ausreichenden Interconnect und einen guten Preis. Kosteneffizient wäre es somit, die ohnehin vorhandene Dual-Channel-APU um einen passenden Interconnect zu erweitern - fertig. Kaum Enwicklungskosten, flexible Skalierung, Markt abgedeckt.
(wäre eigentlich wirklich mal eine Idee für AMD: Eine 990FX Northbridge und zwei Kaveri auf ein MCM. 4 Speicherkanäle und 1 HT-Link, würde mit etwas Glück als Drop-In-Replacement in Dual-G34 Boards laufen und wäre mit 8 Steamroller-Kernen sowie der Beschleunigerleistung einer mittleren FireGL sicherlich ein interessanteres Angebot, als die aktuelen Hexadecacores.)


Das bedeuetet also auf gut Deutsch, dass sich AMD selber ins Bein schießen würde, wenn man den Grafikteil der APUs weiter aufbohren würde? Sprich man würde den eigenen Einsteiger-dGPUs einen Teil des Marktes abgraben? Viele würden sich dann also überlegen: "Wozu sich noch zusätzlich eine R7 270 holen, wenn die APU schon so schnell ist?".

So würde ich das erwarten. Plus machen würde man zwar bei denjenigen, die vor der Überlegung "GT640 holen" standen. Aber man muss sich halt darüber im klaren sein, dass rund 1/3 der Verkäufe kein zusätzlicher Gewinn zugeordnet werden kann, sondern es nur eine Umverteilung ist. Die teure Entwicklung der aufwendigen Plattform müsste sich allein aus den restlichen 2/3 der Verkäufe rentieren.


Nein hat Kaveri nicht.
Eine gemeinsame Cache-Stufe wäre aber schon cool, Intel hat es seit Sandy-Bridge.

Einheitliche Cache-Stufen kommen und gehen. Intel hatte sie zum ersten Mal beim Core Duo, dann war sie bei den ersten Quads wieder weg, seit Dunnington respektive Bloomfield war sie wieder da, seit Sandy Bridge haben wir im Prinzip eine Mischform. Denn der einheitlich angegebene L3 Cache ist ja eigentlich in jedem Kern zugeordnete Segmente unterteilt. AMD hatte sie erstmals bei K8, aber seit K10 nur bei den Oberklassemodellen.
Das Konzept ist halt zweischneidig: Auf der einen Seite verbessert die Ressourcenausnutzung, weil jeder Kern rankommt. Je nach Interconnects kann sie auch den Austausch erleichtern. Auf der anderen Seite ist ein so großer Cache mit sovielen Anbindungen komplex und damit langsam anzusteuern, bringt also weniger, als mehrere kleine Caches. Da auf kleinen Zweimodulern der Datenaustausch kein Problem sein sollte und sowieso immer beide Kerne beschäftigt sind, halte ich persönlich AMDs aktuelle Strategie für angemessen.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Das kann nicht sein!
Entweder wäre das ein Zeichen dafür, dass DDR4 ein Flop geworden ist, oder irgendein Chef-Entwickler bei AMD ist mit Dummheit geschlagen!


Ohne mehr Speicherbandbreite KANN man keine stärkere Grafikleistung erzielen und ohne mehr Performance könnte man eine nächste Generation gleich begraben!

Ein anderer Grund: Der Preis! Denn was bringt es, die APUs billiger zu verkaufen als deren Intel Pendants nur um den Preisvorteil durch all zu teure DDR4 Module wieder zunichte zu machen bzw. gar ins Gegenteil zu bekehren? DDR4 wird imho nicht vor Ende 2015 überhaupt in richtig bezahlbare Regionen kommen, weshalb ich davon ausging, AMD würde ein Refresh (wie sie es mit Richland getan haben) dazwischenschieben und erst danach einen richtig neuen Chip sowohl mit Excravator (oder gar einer anderen Architektur) UND DDR4 rausbringen. Und wenn ich mir das Schema so anschaue, kommt es mir vor, als würde Carrizo wohl wieder so für um den Jahreswechsel geplant sein - zu früh für bezahlbare DDR4 Chips

Andererseits könnte nun Carrizo als Zwischenlösung dienen. Der hat zwar nun dann schon Excravator, jedoch könnte dann dessen Nachfolger sowohl ein Excravator Refresh als auch DDR4 bringen... oder vielleicht sogar ein GDDR6 auf DDR4 Basis? :D

Nein hat Kaveri nicht.
Eine gemeinsame Cache-Stufe wäre aber schon cool, Intel hat es seit Sandy-Bridge.

Die FX haben L3 Cache. Trinity ist quasi ein Piledriver FX gewesen bei dem der L3 durch den Grafikpart ersetzt wurde
 
Zuletzt bearbeitet:
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Einheitliche Cache-Stufen kommen und gehen. Intel hatte sie zum ersten Mal beim Core Duo, dann war sie bei den ersten Quads wieder weg, seit Dunnington respektive Bloomfield war sie wieder da, seit Sandy Bridge haben wir im Prinzip eine Mischform. Denn der einheitlich angegebene L3 Cache ist ja eigentlich in jedem Kern zugeordnete Segmente unterteilt. AMD hatte sie erstmals bei K8, aber seit K10 nur bei den Oberklassemodellen.
Das Konzept ist halt zweischneidig: Auf der einen Seite verbessert die Ressourcenausnutzung, weil jeder Kern rankommt. Je nach Interconnects kann sie auch den Austausch erleichtern. Auf der anderen Seite ist ein so großer Cache mit sovielen Anbindungen komplex und damit langsam anzusteuern, bringt also weniger, als mehrere kleine Caches. Da auf kleinen Zweimodulern der Datenaustausch kein Problem sein sollte und sowieso immer beide Kerne beschäftigt sind, halte ich persönlich AMDs aktuelle Strategie für angemessen.

Die Tausend Leut ach Hust die Paar Hundert Leute bei AMD entwickeln dann Loop ,Micro-Ops,Hsa,hUMA und den Turbo Eiscremeportionierer im vorbeigehen.:schief:
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Je nach Interconnects kann sie auch den Austausch erleichtern. Auf der anderen Seite ist ein so großer Cache mit sovielen Anbindungen komplex und damit langsam anzusteuern, bringt also weniger, als mehrere kleine Caches. Da auf kleinen Zweimodulern der Datenaustausch kein Problem sein sollte und sowieso immer beide Kerne beschäftigt sind, halte ich persönlich AMDs aktuelle Strategie für angemessen.
Mein Standpunkt ist eben, dass bei Intel CPU und GPU sich einen kohärenten 512-Bit breiten Ring teilen und Zugriffe auf die unterschiedlichen L3-Segmente haben.
Bei AMD gibt es dagegen einen bisher 128-Bit breiten FCL Bus, bei Kaveri wird er glaube ich auf 256-Bit aufgebohrt, allerdings ist das ganze nicht so eng verschaltet wie bei Intel, wo Intel ihre Befehle für die GPU in den L3-Cache schreiben kann und die GPU direkt aus diesem auslesen, während bei AMD klassisch aus dem Speicher geholt werden muss oder über die zusätzlichen Verbindungen.
Ebenso hilft so ein Cache natürlich auch der GPU bei der Bandbreite, woran AMDs GPUs verhungern, während Intel noch paar MB L3-Cache hat und mit dem eDRAM sowieso gnadenlos vorne ist.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Das bedeuetet also auf gut Deutsch, dass sich AMD selber ins Bein schießen würde, wenn man den Grafikteil der APUs weiter aufbohren würde? Sprich man würde den eigenen Einsteiger-dGPUs einen Teil des Marktes abgraben? Viele würden sich dann also überlegen: "Wozu sich noch zusätzlich eine R7 270 holen, wenn die APU schon so schnell ist?".

Genau DAS war aber auch der ursprüngliche Gedanke der APU-Entwicklung, nämlich dGPUs bis zu einem gewissen Bereich vollkommen sinnlos zu machen.

Damit sich das für AMD aber wirklich lohnt müssen die APUs einen kompletten Chip fresssen.
Kaveri wird das mit dem Oland/Mars-Chip machen, von den Dingern und deren Nachfolgern wird AMD einfach nichts mehr herstellen (bzw. nur noch extrem-kastrierten Schrott aus oberen Etagen anbieten) und damit auch die gesammten Entwicklungskosten für diesen LowEnd-Chip spaaren!

Die Frage ist nur: Bis wohin will AMD diese Deadline ausweiten?
Mit QuadChannel DDR3/ TripleChannel DDR4 würde die Performance sicher reichen, um auch den 7770/7790-Bereich zu schlucken. Nur dann muss sich AMD wirklich hüten, denn darüber wird es von Investition zu praktischem Marktanteilsgewinn echt heikel!
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Die Tausend Leut ach Hust die Paar Hundert Leute bei AMD entwickeln dann Loop ,Micro-Ops,Hsa,hUMA und den Turbo Eiscremeportionierer im vorbeigehen.:schief:

Du zitierst mich, aber ich sehe keinerlei zusammenhang zu meinen Aussagen :huh:

Also den Turbo Eiscremeportionierer würde ich sofort kaufen :devil:

Erstmal abwarten, wie Effizient er ist. Abwärme ist bei Turbo Eiscremeportionierern ein echt heikles Thema.


Mein Standpunkt ist eben, dass bei Intel CPU und GPU sich einen kohärenten 512-Bit breiten Ring teilen und Zugriffe auf die unterschiedlichen L3-Segmente haben.
Bei AMD gibt es dagegen einen bisher 128-Bit breiten FCL Bus, bei Kaveri wird er glaube ich auf 256-Bit aufgebohrt, allerdings ist das ganze nicht so eng verschaltet wie bei Intel, wo Intel ihre Befehle für die GPU in den L3-Cache schreiben kann und die GPU direkt aus diesem auslesen, während bei AMD klassisch aus dem Speicher geholt werden muss oder über die zusätzlichen Verbindungen.

Afaik gibt es bei Koordination von GPU und CPU spätestens mit hUMA keine Nachteile mehr bei AMD, sieht man mal von der schlichtweg fehlenden gemeinsamen Cache-Stufe ab (s.u.), aber selbst die dürfte latenztechnisch kein Problem sein, solange es ums Rendering geht. Und bei Logik-Operationen will man ja idealerweise schnellstmöglich mit den Ergebnissen weiterarbeiten, also kann man diese auch ohne Zwischenspeichern und Umweg direkt übergeben.
Bzgl. der Busbreiten: Der FCL ist nur für die Kommunikation GPU<->CPU zuständig. GPU<->RAM geht über den RMB, CPU<->RAM hat die Crossbar direkt angebunden, die intern auch CPU<->CPU regelt und Cache-Zugriffe laufen, innerhalb der Module noch einmal getrennt. Intels Ring-Bus dagegen muss die gesamte Kommunikation zwischen allen Kernen, alle Zugriffe auf abseits gelegene L3 slices, alle GPU-Cache-Operationen und alle Speicherzugriffe verkraften. Da ist eine etwas breitere Auslegung kein Bonus, sondern zwingend nötig.

1Ebenso hilft so ein Cache natürlich auch der GPU bei der Bandbreite, woran AMDs GPUs verhungern, während Intel noch paar MB L3-Cache hat und mit dem eDRAM sowieso gnadenlos vorne ist.

Jup, mit eDRAM hat Intel einen gnadenlosen Vorteil. Aber halt auch in einer Preisklasse, in der es niemanden gibt, gegenüber dem man diesen Vorteil ausspielen könnte.
Dass der gemeinsame LLC soviel bringt, wage ich dagegen zu bezweifeln. In der Leistungsklasse, in der die 4600er Grafikeinheit tatsächlich mal in Verlegenheit gerät, etwas zu rendern, ist der L3 winzig und die CPU-Kerne wollen auch ihren Teil. Grafikaufgaben sind dagegen eher groß, schon die 32 MB eSRAM der X1 werden weithin als unzureichend kritisiert. Umgekehrt hat Intel gesagt, dass die 128 MB eDRM ein bißchen Overkill sind und die Hälfte gereicht hätte. Ich glaube nicht, dass die vielleicht 1 MB L3, die für die GPU abgestellt werden können, einen großen Unterschied machen, wenn der Bedarf eigentlich bei 64 MB liegt. Für gpGPU ist der gemeinsame LLC natürlich eine wesentlich elegantere Lösung, als AMDs Ansatz mit 3 verschiedenen Bus-Systemen. Aber Eleganz, die keinen Unterschied bei der Leistung macht, ist dem Endkunden sicherlich egal.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Bye AMD. Hätte einen neuen Bulldozer auf Leistungs höhe eines i5/i7 gehofft.

Apus interessieren mich weniger.

Die Leistung ist für Spiele zu schwach (aktuelle Spiele). Daher geht genauso ein Intel CPU mit iGPU.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Im Server-Markt brauchst du nicht "eine" große iGPU + große CPU + großes SI. Da brauchst du nur ein ausgeglichenes Verhältnis, einen ausreichenden Interconnect und einen guten Preis. Kosteneffizient wäre es somit, die ohnehin vorhandene Dual-Channel-APU um einen passenden Interconnect zu erweitern - fertig. Kaum Enwicklungskosten, flexible Skalierung, Markt abgedeckt.
(wäre eigentlich wirklich mal eine Idee für AMD: Eine 990FX Northbridge und zwei Kaveri auf ein MCM. 4 Speicherkanäle und 1 HT-Link, würde mit etwas Glück als Drop-In-Replacement in Dual-G34 Boards laufen und wäre mit 8 Steamroller-Kernen sowie der Beschleunigerleistung einer mittleren FireGL sicherlich ein interessanteres Angebot, als die aktuelen Hexadecacores.)
Wie gesagt, MCM habe ich ja schon selbst vorgeschlagen um z.B. recht kostengünstig das Quad-Channel-SI zu bekommen. Darüber hinaus sollte man aber durchaus auch noch SMP unterstützen zumindest mit 2 APUs.

HT wäre dafür eigentlich die Wahl bei AMD ich glaub aber nicht, dass das noch kommen wird. Dafür wurde zu lange einfach nichts mehr bei HT gemacht. DA kommt eher nen PCI-E 3.0 Derivat daher.

Mit den Entwicklungskosten ist es halt auch so ne Sache. Wenn man wirklich große APUs bringt, muss man keine echt großen CPUs mehr bringen. Die substituieren sich einfach großteils für AMD. Man hat also nicht einfach doppelte Entwicklungskosten.

Bzgl Server im Allgemeinen noch was. Klar braucht man ausgewogene Systeme, aber die kann man eben auch um einen FAktor 2 größer machen als aktuell und vor allem die Priorisierung weiter Richtung iGPU verschieben. Gerade durch HSA bezweckt man ja auch gerade die iGPU für 0815 Aufgaben ein zu setzen. Intel macht unterm STrich mit ihren 512 Bit Registern ja auch nichts anderes. Die Komnzepte nähern sich hier aus unterschiedlichen Richtungen mal wieder gegenseitig an. Das zeigt auch, dass das ganze Konzept an sich gut ist.

Klassische CPUs werden wir nicht mehr lange sehen, und wenn dann nur noch in wirklichen Randbereichen.

Einheitliche Cache-Stufen kommen und gehen. Intel hatte sie zum ersten Mal beim Core Duo, dann war sie bei den ersten Quads wieder weg, seit Dunnington respektive Bloomfield war sie wieder da, seit Sandy Bridge haben wir im Prinzip eine Mischform. Denn der einheitlich angegebene L3 Cache ist ja eigentlich in jedem Kern zugeordnete Segmente unterteilt. AMD hatte sie erstmals bei K8, aber seit K10 nur bei den Oberklassemodellen.
Das Konzept ist halt zweischneidig: Auf der einen Seite verbessert die Ressourcenausnutzung, weil jeder Kern rankommt. Je nach Interconnects kann sie auch den Austausch erleichtern. Auf der anderen Seite ist ein so großer Cache mit sovielen Anbindungen komplex und damit langsam anzusteuern, bringt also weniger, als mehrere kleine Caches. Da auf kleinen Zweimodulern der Datenaustausch kein Problem sein sollte und sowieso immer beide Kerne beschäftigt sind, halte ich persönlich AMDs aktuelle Strategie für angemessen.
Das wird wirklich immer wieder so sein, man verschiebt halt Grenzen immer wieder nach hinten, und da kommen dann immer wieder alte Lösungen in neuem GEwand daher. Das ist ganz normal ;)

Bzgl Intel und L3. Das ist schon EIN! Cache, auf den alle eine globale Sicht haben. Die Zuteilung zu "einem Core" ist da nicht wirklich treffened. Es gibt an sich keine Zuteilung. Die Latenzen sind nur für jeden Slice unterschiedlich groß und Jeder Core hat halt einen Slice bei dem die Latenz halt minimal ist. Dennoch ist es ein großer shared Cache. Man "optimiert" ihn halt "nur".
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Aus Sicht der Software bzw. Veraltung erscheint es als ein Cache. Hardwareseitig verbaut Intel aber einen unabhängigen L3 pro Kern mit den typischen Vor- und Nachteilen, die das hat.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Definiere dann mal bitte "unabhängigen L3 pro Kern".

Jeder Cache an sich ist segmentiert durch die Assoziativität, es sei denn er ist vollassoziativ. Im Prinzip ist das halt ein Multiport Cache, wobei jeder Port halt "nur" auf gewisse Bereiche zugreifen kann. Die Ansicht es würde eine Zuordnung zu den Cores bestehen kommt durch den Interconnect zwischen dem Cache und den Cores. Nicht aber vom L3 Cache an sich. Hättest du nen Crossbar dazwischen, würdest du von keiner Zuordnung sprechen.

Die Cores haben auf die Slices hat unterschiedliche Latenzen, deswegen macht eine gewisse Zuordnung Sinn, aber das kommt eben durch den Ringbus und nicht durch die Segmentierung des Caches an sich. Ich bin mir auch gar nicht sicher, welches Protokoll da die Caches synct. Auch hat nicht jeder Slice die volle Assoziativität meines Wissens nach. Daten von einem Core hängen also durchaus auch in den anderen Slices, je nachdem was halt die Cache-Policy macht.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

"unabhängig" = "arbeitet selbsständig". Besitzt eigene Verwaltungseinheiten für alle Aufgaben". "Würde auch dann und genauso funktionieren, wenn die anderen nicht da sind."
"pro Kern" = "einem Kern zugeordnet". "mit einem einzelnen Kern besonders assoziiert".

Und ja, wenn die Anbindung über eine Crossbar erfolgen würde, wäre es nicht mehr einzelnen Kernen "zugeordnet". Es blieben aber 2/4 eigenständig agierende Slices. Mit einem monolithischen Cache, der einen zentralen Zugriff auf alle Bereiche bietet (z.B. C2D), ist dies nicht vergleichbar. Eher mit verteilten Caches. Letztlich ist es afaik auch bei AMD möglich, dass direkt auf Daten in einem anderen (L2) Cache zugegriffen wird. (Zumindest war das bei K10 so iirc.) Unterschiede resultieren da auch nur aus dem längeren Zugriffsweg mit Umweg über Interconnects. Da käme aber nie jemand auf die Idee, deswegen von einem einheitlichen L2 Cache zu sprechen, weil die einzelnen Cache-Bereich eben physisch mit je einem Modul(/Kern) assoziiert sind.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

Ich habe kein Problemm damit das die nur APUs vekaufen, Intel macht es ja auch nicht anders.
Was mich stört ist das sie einfach keine APUs im progrmm haben die eine vernünftige Leistung zum Spielen liefern.
Die sollen mal eine Octa-Core APU raus bringen.
 
AW: AMD-Roadmap: Carrizo-APUs kommen 2015 - ohne DDR4-Unterstützung, mit Excavator-Kernen

ich denke mal das wird kommen wenn AMD soweit ist etwas zu Bauen das deutlich mehr Leistung bringt als die FX Serie.

Von mir aus können sie auch FM2+ 6 und 8 Kerner ohne igpu bauen. Denn die brauchen die meisten in der Leistungsklasse eh nicht.



Aber ich gehe davon aus das wenn für Sockel FM Chips gebaut werden können die 6 und mehr kerne haben deren Leistung (IPC) 20% über dem der FX liegt wird da auch sicherlich was kommen. Wenn AMD oben mitspielen kann dann werden sie das auch machen.

Mal sehn obs was wird.


Gruß Sunjy
 
Zurück