Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Aber eigentlich kann doch ein schlechter Fertigungsprozess nur den Takt limitieren, nicht die Perfromance/Takt.

Stimmt schon. Aber wenn man eine Architektur eigentlich auf höhere Taktraten optimiert hat (und das hatte AMD für BD mal angekündigt), und dann die Fertigung verhindert, dass man die erreicht, dann steht man genauso blöd da, wie Intel mit dem Prescott (bei dem es allerdings die Verlustleistung bzw. Kundenakzeptanz bremste) ;)


Und auch an Ruyven:

Die Architektur wird eher mit Papier und Stift "entwickelt" Da sind ja mathematische Modelle dahinter bzgl TLB, Cohärenzprotokoll etc. Dazu entwirft man halt noch die Breiten der ALUs etc. und hat dann praktisch seine grobe Architektur.

Wie das dann wirklich realisiert wird, muss man dann eh in VHDL/Verilog whot ever machen. Da heißt es dann halt Logik runterschreiben und auf den SMP-Rechner schmeißen und warten, wie er Placement und Routing macht, und dann halt schauen ob das Ding überhaupt läuft wie gewünscht, und wenn, welche Taktraten drin sind.

Das klappt bei kleinen Schaltungen, die du einigermaßen überschauen kannst. Einen >1 Milliarde Transistoren Chip zu fertigen, ohne vorher mal einen simulierten Testlauf zu machen, wie alle Funktionseinheiten zusammenarbeiten, ist afaik eine sehr kostspielige Idee. Viele Parameter sind (Cache Größen, Decoderbreite,...) sind auch prinzipiell skalierbar und da ist es einfacher, simuliert zu testen, was sich noch lohnt, als große Mengen Software in Theorie zu simulieren.


Als die Phenom II, genauer der X4 940 BE, im Januar 2009 erschienen, war der QX9770 im Mittel schneller und oft auch der Q9550. Auch in unserem aktuellen Parcours gilt Q9550 > X4 940 BE.

Jaja, ich hab meinen Fehler doch eingestanden ;)


Wenn man denn jetzt bei AMD nach schaut, dann fragt man sich doch ernsthaft warum die noch beim B2-Stepping sind und offensichtlich ja auch bleiben wollen, wenn es nach diesem Testergebnis doch anscheinend so grotenschlecht aussieht.

Wie gesagt: Wenn AMD keinen Zugriff auf eine eigene Prototypenfertigung mehr hat, dann sie in dem gleichen Dilemma, wie AMD/ATI. Eine Änderung am Routing (typischerweise in der Zahl angegeben) lässt sich noch einigermaßen bewerkstelligen, afaik meist 1-2 Monate. Aber ein Änderungen auf Siliziumebene kann bei einem externen Fertiger afaik durchaus teuer werden (der will ja auch planen, was bei ihm vom Band läuft - und wenn du sagst, "ooch nö, so gefällt uns das noch nicht, wir bestellen jetzt erstmal ne neue Maske und 2-3 Monaten stellt ihr die Maschienen noch mal für eine Testfertigung neu ein", dann steht das auch auf der Rechnung) und schon mal ein halbes Jahr dauern.
Intel dagegen geht "nach Nebenan", legt ggf. noch ein paar € drauf, wenn die Maske schnell da sein muss (siehe Cougar Point-Relaunch. War zwar nur Routing, aber geschätzt 2-3 Wochen bis zur Wideraufnahme der Serienproduktion waren eine Meisterleistung, selbst Intel hatte ja ursprünglich zwei Wochen mehr angekündigt), und kann das nächste Stepping testen.


Das ist mir klar aber warum? Warum hinkt GF seit Jahren um immer 2 Jahre/einen Full Node hinterher? Schaut echt immer so aus, als könnten die garnichts bei GF. So 6 Monate oder so würd ich mir ja eingehen lassen, Intel hat mehr Erfahrung, größere/mehr Werke, etc aber 2 Jahre? Da muss ich halt schon stark an den Ingenieuren und Wissenschaftlern bei GF zweifeln und ich wüsst halt gern woran es wirklich liegt.

Das hier ist kein Sportwagenrennen, wo man im Windschatten wieder aufholen kann. Wenn man einmal zurückliegt, weil man zu lahm war, dann muss man
- die Geschwindigkeit steigern (die nicht ohne Grund niedriger gewesen sein wird)
- den Rückstand aufholen
- das alles bei sinkenden Einnahmen, weil man schlechtere Produkte hat
Dazu kommt noch, dass AMD an SOI festhält, was zusätzliche Probleme mit sich bringt (aber im Vergleich zu 130 nm Zeiten nur noch wenig Vorteile)

In sehr vielen Firmen werden PCs zur Produktivität eingesetzt und wenn die CPU etwas schneller berechnet, dann ist man produktiver sprich man verdient mehr Geld und hat weniger Leerlauf.

Ich denke mal die Firmen, in denen die CPU-Leistung an der Produktivität beteiligt ist, machen einen verdammt kleinen Teil des Marktes auf. Hunderte Millionen Bürorechner arbeiten maximal so schnell, wie der Nutzer, der vor ihnen sitzt.


Gerade die sehr gute RAM-Bestückung bei den AMD-Kisten ist teils wirklich sehr interessant ;)

Mal so ne Frage: Meinst du damit eigentlich immer die (relativ) zu Dumpingpreisen verfügbaren Quad-Channel-CPUs (bzw. Multi-CPU-Kombinationen mit entsprechend mehr Kanälen), oder die Bestückung pro Kanal? Denn wann immer ich in der Vergangenheit geguckt habe (ist jetzt zugegebenermaßen eine Weile her), war AMD froh, wenn sie vier Rows ohne deutlich gesenkte Performance ansteuern konnte, während die Xeons afaik bis heute recht problemlos mit sechs Rows arbeiten (zu Single-Channel-Zeiten hat Intel sogar acht gestemmt) oder sogar Extender unterstützen.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Er meint: "Wenn es AMD nicht gäbe [...]." den rest kannst du dir selbst zusammenreimen.

@Das Daub: Siehste? Teeraucher gibts hier auch. :D
Wenn es AMD nicht gebe, hätte man Intel wegen der Monopolstellung schon längs zerschlagen und deswegen bin ich mir sicher, dass Intel alles tun wird damit AMD nicht pleite geht.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

[URL="http://extreme.pcgameshardware.de/members/62-ruyven_macaran.html" schrieb:
ruyven_macaran[/URL]

]


Das hier ist kein Sportwagenrennen, wo man im Windschatten wieder aufholen kann. Wenn man einmal zurückliegt, weil man zu lahm war, dann muss man
- die Geschwindigkeit steigern (die nicht ohne Grund niedriger gewesen sein wird)
- den Rückstand aufholen
- das alles bei sinkenden Einnahmen, weil man schlechtere Produkte hat
Dazu kommt noch, dass AMD an SOI festhält, was zusätzliche Probleme mit sich bringt (aber im Vergleich zu 130 nm Zeiten nur noch wenig Vorteile)

GF ist nicht direkt von den Einnahmen von AMD abhängig:
1. Fertigen sie auch für andere
2. Kriegen sie massig Geld von arabischen Investoren

Senkt SOI die Yield und Güte wirklich sooo dramatisch? Außerdem bringt SOI doch den Vorteil der geringeren Leckströme und das gilt auch heute noch.

[URL="http://extreme.pcgameshardware.de/members/62-ruyven_macaran.html" schrieb:
ruyven_macaran[/URL]

]
Ich denke mal die Firmen, in denen die CPU-Leistung an der Produktivität beteiligt ist, machen einen verdammt kleinen Teil des Marktes auf. Hunderte Millionen Bürorechner arbeiten maximal so schnell, wie der Nutzer, der vor ihnen sitzt.


Du hast zwar recht, das viele PCs in Büros landen, aber dort ist die verbaute CPU meistens eh völlig wurscht.
Dass PCs als Produktivgerät nur selten vorkommt ist jedoch falsch. In jedem Technologiekonzern, an jeder Uni, in Banken etc. braucht man schnelle PCs die komplexe Dinge berechnen wenn die Simulation bei VW statt 30min nur noch 10min dauert, dann hat man viel gewonnen, weil man auch einfach mehr ausprobieren kann. Mein Vater arbeitet selber für eine Laser- und Optikfirma und je nach Bereich, in dem du arbeitest ist eine schnelle Workstation Pflicht, weil du es dir nicht leisten kannst jeden Tag 1 Stunde auf deinen PC zu warten. Mein Vater selbst hat Glück, er hat einen C2D E5300 und kommt pro Tag viell. auf 10min Leerlauf, das ist in Ordung.

Weiterhin musst du bedenken, dass es zwar relativ wenige Supercomputer gibt, pro Farm dann aber gern mal 10.000-100.000 CPUs verbaut werden. Das ist bei den hohen Preisen für Server-CPUs und insbesondere für AMD ne Riesengeschichte.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Mein Persönlicher "Tick-Tock" macht damit wieder "Tock" für AMD.

Das wird mich sicherlich jucken, wenn der Preiskampf ordentlich einsetzt ....
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

GF ist nicht direkt von den Einnahmen von AMD abhängig:
1. Fertigen sie auch für andere
2. Kriegen sie massig Geld von arabischen Investoren

Die "anderen" haben aber allgemein wenig Interesse am teuren SOI und GF hat mehrfach Bulk-Prozesse mit sehr aggressiven Zeitplänen angekündigt. Wenn unerfahrene Investoren verlangen, dass ein Team eine komplette zweite Produktionsschiene in bis dato ungenutzter Technik entwickelt, dann führt das zwangsläufig zu verlangsamter Arbeit an der (ehemals) primären Entwicklungsschiene, weil Teile des Teams ausgetauscht werden.

Senkt SOI die Yield und Güte wirklich sooo dramatisch? Außerdem bringt SOI doch den Vorteil der geringeren Leckströme und das gilt auch heute noch.

Yield und Güte eigentlich nicht. Aber es gilt eben eine komplette zusätzliche Struktur in der Entwicklung zu berücksichtigen -> man muss mehr forschen, mehr testen. Das braucht mehr Zeit.
Und der Vorteil waren afaik nicht Leckströme, sondern der Stromaufwand beim Schalten. Deswegen konnte AMD lange Zeit vergleichsweise komplexe Architekturen ohne Temperaturprobleme oder extrem niedrige Taktraten anbieten. Aber die Leckstörme sollten ähnlich sein und weil die im Vergleich zur eigentlichen Arbeit bei kleinen Größen immer wichtiger werden, ist SOI eben immer weniger im Vorteil. ("afaik" ist in dem Fall aber "nicht sehr weit". Skysnake weiß vielleicht mehr?)

Du hast zwar recht, das viele PCs in Büros landen, aber dort ist die verbaute CPU meistens eh völlig wurscht.
Dass PCs als Produktivgerät nur selten vorkommt ist jedoch falsch. In jedem Technologiekonzern, an jeder Uni, in Banken etc. braucht man schnelle PCs die komplexe Dinge berechnen wenn die Simulation bei VW statt 30min nur noch 10min dauert, dann hat man viel gewonnen, weil man auch einfach mehr ausprobieren kann. Mein Vater arbeitet selber für eine Laser- und Optikfirma und je nach Bereich, in dem du arbeitest ist eine schnelle Workstation Pflicht, weil du es dir nicht leisten kannst jeden Tag 1 Stunde auf deinen PC zu warten. Mein Vater selbst hat Glück, er hat einen C2D E5300 und kommt pro Tag viell. auf 10min Leerlauf, das ist in Ordung.

:ugly:
Und genau sowas meine ich mit Arbeitsplätzen, an denen die Rechenleistung kaum was ausmacht. Ich hab Exceldokumente bei denen ich, wenn ich den ganzen Tag damit arbeiten würde, vermutlich mehr als 10 Minuten mit warten verbringen würde, weil mein E5300 die nicht mal eben speichert.
Aber das ist Low-End für heutige Verhältnisse. Einen modernen Mittelklasse-Quadcore lastet du mit Office oder durchschnittlichen Statistikaufgaben nicht mehr aus. Da musst du eben echt mit Simulationen daherkommen - aber wie viele Mitarbeiter hat ein Konzern, die tatsächlich eigenständig große Simulationen ausführen? Oftmals steckt da ein ganzes Team dahinter und die entwickeln weitaus mehr, als sie simulieren. (Bzw. die Simulanten, die nicht entwickeln, sind eh zu Hause :ugly: )
Sowas lässt man, genauso wie Bankenverwaltung, gleich über den Server laufen, der dann wechselseitig von mehreren Leuten ausgelastet werden kann. So kann man viele Leute mit großen Aufgaben diese mit relativ wenig CPUs in annehmbarer Zeit durchrechnen lassen. (Jedenfalls wenn man das Ding richtig konfiguriert...)


Weiterhin musst du bedenken, dass es zwar relativ wenige Supercomputer gibt, pro Farm dann aber gern mal 10.000-100.000 CPUs verbaut werden. Das ist bei den hohen Preisen für Server-CPUs und insbesondere für AMD ne Riesengeschichte.

Hatten wir weiter oben schonmal...
Auch für AMD sind 100 Großrechner a 50.000 CPUs bei 1000 € pro CPU nicht mehr Geld, als 1000 Großstädte a 500.000 CPUs bei 100 € pro CPU.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Ok, das mit GF leuchtet mir soweit ein, hab mich da nicht soo reingelesen....


Natürlich sind der Großteil der PCs Bürorechner, aber es gibt eben auch massig Leute, die mehr damit machen. Und die brauchen dann diese starken CPUs, das berücksichtigen viele Gamer nicht, so wie der gute Mann oben.


Hatten wir weiter oben schonmal...
Auch für AMD sind 100 Großrechner a 50.000 CPUs bei 1000 € pro CPU nicht mehr Geld, als 1000 Großstädte a 500.000 CPUs bei 100 € pro CPU.

Du meinst wohl 50.000 CPUs ;)

Nur leider verkauft AMD nicht so viele CPUs und die Margen sind teils noch höher als 1000€. Insgesamt ist das Servergeschäft ziemlichlukrativ, ein Grund warum AMD und AMD/ATi so wenig Gewinn machen, weil sie da schlecht aufgestellt sind. nVidias Milliarde pro Quartal kommt nicht von ungefähr.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Das klappt bei kleinen Schaltungen, die du einigermaßen überschauen kannst. Einen >1 Milliarde Transistoren Chip zu fertigen, ohne vorher mal einen simulierten Testlauf zu machen, wie alle Funktionseinheiten zusammenarbeiten, ist afaik eine sehr kostspielige Idee. Viele Parameter sind (Cache Größen, Decoderbreite,...) sind auch prinzipiell skalierbar und da ist es einfacher, simuliert zu testen, was sich noch lohnt, als große Mengen Software in Theorie zu simulieren.
Die Tools fürs Placing und Routing sind aber nicht wirklich super was die Skalierung angeht. Da sitzt du an einem relativ "kleinen" Chip mit ner wirklich großen SMP Maschine schon nen guten Tag dran. Das Problem ist ja ~NP-äqzuvalent (oder wars sogar NP-Vollständig?) Schau einfach nach Traveling Salesman Problem, dann siehst du was ich meine. Die Tools sind dabei leider nicht wirklich gut, was die Skalierung angeht. Keine Ahnung, ob AMD/Intel da nochmals andere haben, aber ich würde nicht davon ausgehen, dass da ein kompletter Chip in weniger als einer Woche geplaced und geroutet werden würde. Daher macht man ja auch eigentlich einzelne Funktionseinheiten, wie eben den DDR-Controller, den HT-Controller, Northbridge, etc. etc. Das verkleinert halt das Problem. >1 Tag sollte für einen Core aber dennoch eingeplant werden, denke ich mal. Keine Ahnung wie stark die das segmentieren.

Naja, und am Anfang sitzt du daher eben schon mit "Blatt und Bleistift" da und denkst dir aus, wie etwas funktionieren soll. Einfach mal ein Kohärenzprotokoll in Hardware zu werfen, und dann zu schauen was bei rum kommt kannste knicken. Genau so wie andere Sachen. Klar bei so Sachen wie ner Integer-Pipeline kannste das mal machen, oder an anderen kleinen Dingen, halt optimieren, aber ansonsten dauert das einfach viel zu lange, und ist nur stochern im Trüben. Da gibts ja durchaus Leute, die sich hinsetzen, und dir mathematisch beweisen, das ein bestimmter Algorithmus effizienter ist als ein anderer, und so was packt man dann halt in Hardware. Die Theorie gibt dir ja allgemein eine Abschätzung nach oben, was die Leistungsfähigkeit anbelangt. Wenn die schon zu niedrig ist, musst du dir dabei gar nicht mehr um die Implementierung kümmern. Am Ende haste halt ein paar Kennzahlen, wie die Größe der Cacheline, Datendurchsatz für die einzelnen Stufen, den Instr.-Durchsatz für das Frontend, etc etc etc. Darauf entwickelste halt hin, und versuchst das halt möglichst effizient zu implementieren, wo man teils wirklich nur um try and error drum rum kommt, aber ohne einen konkreten Plan, wie das alles später aussehen soll, kommst du da nicht weit. Den Tools mal mit einer eigenen Vorgabe bzgl. Placement und Routing auf die Sprünge zu helfen soll oft auch sehr hilfreich sein, da brauchs teils aber halt einfach das "Feeling" dafür, was funktioniert, und was nicht...

Das erinnert mich grad spontan an das Lösen von Gleichungen durch genaues hinsehen in der Algebra :schief:

Klingt komisch, funktioniert aber teilweise verdammt gut, wenn man drin ist :devil:

Mal so ne Frage: Meinst du damit eigentlich immer die (relativ) zu Dumpingpreisen verfügbaren Quad-Channel-CPUs (bzw. Multi-CPU-Kombinationen mit entsprechend mehr Kanälen), oder die Bestückung pro Kanal? Denn wann immer ich in der Vergangenheit geguckt habe (ist jetzt zugegebenermaßen eine Weile her), war AMD froh, wenn sie vier Rows ohne deutlich gesenkte Performance ansteuern konnte, während die Xeons afaik bis heute recht problemlos mit sechs Rows arbeiten (zu Single-Channel-Zeiten hat Intel sogar acht gestemmt) oder sogar Extender unterstützen.
Klar mein ich damit die Quadchannel Systeme mit 8 DIMM-Sockel. Wenn du aber z.B. mal bei SuperMicro auf der HP die Produkte naschaust, wirst du sehen, dass sehr viele AMD Systeme mit 2 CPUs 256GB RAM verpacken, und die 4 CPU Systeme halt 512 GB. Intel ist bei sehr vielen Systemen bei 2 CPUs auf 192 GB beschränkt.

Du kommst halt billiger an RAM ran, was auch nicht immer verkehrt ist, und für manche Sachen, wie Finanzial Trading ist der HT-Sockel für FPGAs auch alles andere als zu vernachlässigen. Wenn da die Algorithmen direkt in Hardware gepresst werden, kommste da mit ner normalen CPU nicht mit, egal wie schnell die ist, und da dreht sichs ja hauptsächlich um Latenzen. Bei Intel siehts da eher schlecht aus. Ich wüsste keinen FPGA, der direkt auf einem aktuellen Sockel aufsetzt, und eben nicht über den PCI-E Port geht, der halt höhere Latenzen hat. Wobei da ehrlicher weiße gesagt sein muss, das da wohl etwas in der Mache ist, soweit ich das mit bekommen habe.

AMD hat definitiv seine Nieschen, in denen Sie eigentlich Konkurrenzlos sind. Ist halt nur die Frage, wie groß diese sind.... Auf diesen Sachen muss halt aufgebaut werden, und für den 0815 Server-Anwender wieder eine höhere Attraktivität erreicht werden.

Naja und lieferfähig müssen Sie auch sein, letztes oder vorletztes Jahr soll dies ja ne längere Zeit nicht der Fall gewesen sein. Damit haben Sie sich sicherlich auch so manchen Kunden vergrault.... Auf Hardware wird eben ungern gewartet...

EDIT:

@Ruyven bzgl SOI bla blub:

Also ich steig da auch nicht durch mit SOI, Bulk etc. etc. Da fehlt mir einfach das Material, dass die einzelnen Verfahren in ausreichender Genauigkeit beschreibt. Wenn ich dir hätte, könnte ich euch sicherlich sagen, was SOI noch bringt, bzw. nicht bringt. etc. etc.

Das Problem ist wohl eher, das man die Transistoren an sich neu designen müsste. Also wirklich jemanden hin setzen, und per Hand die einzelnen Transistoren neu entwerfen, wenn man von einem Verfahren zum anderen übergeht. Klar in einem gewissen Rahmen muss man das auch bei einem Shrink machen, aber wohl nicht in diesem Maße.

Ich kenns halt nur von Erzählungen, das z.B. GF oder TSMC dir halt ne Bibliothek mit unterschiedlichen Transistoren-Layouts hin knallt, und du mit diesen arbeiten kannst. Da ist nicht mal so schnell und einfach ein Wechsel drin, weil man erst mal schauen muss, ob das alles dann überhaupt noch so funktioniert. Wenn man einen Wechsel macht, dann am Besten komplett von vorne beginnend mit einem komplett neuen Design, wo man gar nicht auf alte Sachen zurückgreifen kann.

Allgemein lassen sich die Hersteller da aber aus guten Grund nicht wirklich in die Karten schauen, was jetzt genau möglich ist, und was nicht. Grad bei SRAM etc. kann ich mir auch sehr gut vorstellen, das AMD da eben ihr eigenes Transistor-Layout hat, und wenn man mal so einen echten Verbund gesehen hat, und dazu das Schaltbild, dann weiß man, warum man da nicht wirklich dran rum fummelt. Wenn man net weiß was das darstellen soll, dann wird man es wohl oft nicht herausfinden aufgrund der einzelnen Transistoren. Das sieht wirklich übel aus :ugly:

Mich interessieren die Sachen mit SOI etc. aber auch, hab aktuell aber wirklich keine Zeit dafür.

Was man allgemein halt bedenken sollte ist, das man mehrere Sachen hat, die Stromflüsse verursachen. Der Leckstrom durch den Transistor, der zwischen den Leitungen, und dann halt noch der Strom, der beim schalten des Transistors entsteht, wenn dieser noch nicht fertig geschaltet hat. Was davon jetzt genau wie viel am Gesamten Strombedarf einnimmt, kann ich nicht sagen, aber wenn man sich allgemein so Grafiken anschaut, die zeigen, wie die Leckströme (stationäre Ströme) und die Last bezogenen (variablen) Ströme sind, dann sieht man eigentlich, dass die Leckströme zwar gut etwas ausmachen, aber deutlich geringer sind, als die variablen Ströme, die wohl hauptsächlich durch den Strom gegeben sind, der fließt, während der Transistor noch nicht fertig geschaltet hat.

Dazu kommen halt noch so Späße wie Power-Gating etc. Da bringt einem die tolle aufwendige Konstruktion eben wieder weniger, da der Teil des Chips eh nicht unter Saft steht :rolleyes:

Die Clock sollte man aber z.B. auch nicht vernachlässigen. Dafür geht auch VERDAMMT viel Saft drauf. Glaub allein dafür war das etwas im zweistelligen Prozentbereich. Ich hatte mal die grobe Größenordnung genauer im Kopf, aber so was wars glaub ich. 10-30% ca. irgendwie so etwas.

Deswegen nimmt man ja auch gern ganze Teile vom Chip von der clock runter ;) Zumal das ja immer schlimmer wird je mehr Transistoren der Chip hat, da man immer mehr Transistoren mit der clock ansteuern muss für die Logik, und dann auch noch die Wege immer länger werden, was wieder bedeutet, das man ein stärkeres Signal treiben muss, was mehr Verlustleistung bedeutet usw. usw.

Ich hoffe man versteht so grob die Vielzahl an Problemen, die man sich einhandeln kann, und die sich wechselseitig beeinflussen.
 
Zuletzt bearbeitet:
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Und wann begreifen die Leute endlich, dass es nicht DIE Über-CPU gibt? :schief:

Intel ist in vielen Sachen sehr gut, aber wenn man sehr FP lastigen Code hat, oder sehr viel RAM brauch, dann ist AMD aktuell immer einen näheren Blick wert. ;)
Ja einen Blick wert. Aber Unterm Strich, also alles zusammen genommen ist Intel eben deutlich besser. Was die Leistung angeht. Preis außen vor gelassen.

Frag dich mal warum es aktuell keinen OEM gibt, der AMD in Workstations mit zwei Sockeln verbaut. Intel-Only.

Gerade die sehr gute RAM-Bestückung bei den AMD-Kisten ist teils wirklich sehr interessant ;)
Lange vorbei, selbst in eine 2 Sockel Workstation knallst du bei Intel 192 GB bei 12 DIMM-Sockel. Da kann auch AMD nicht mehr (wenn ichs Recht in Errinnerung hab sogar weniger).
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Doch könne Sie. Hab ich doch sogar geschrieben ;)

AMD = 128GB/CPU in den meisten Fällen
Intel = 96GB/CPU in den meisten Fällen

Und die Aussage von dir zuvor ist halt einfach Falsch. Zeig mir ein Intel System, wo du einen FPGA per QPI anbinden kannst. Im Financial Trading (also um genau zu sein, beim Speedtrading) OC´en Sie teils die CPUs sogar extrem, mit nem FPGA, bist du aber dennoch deutlich schneller, und schneller bedeutet in diesem Fall, dass du das Geld machst, und nicht die Konkurrenz. Da arbeiten aber halt Mathematiker und Ingenieure und keine Börsen"Profis"/Bänker.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Du meinst wohl 50.000 CPUs ;)

Nein, meine ich eben nicht ;)
In einem Städtischen Gebiet mit 5 Millionen Einwohnern (und weltweit gibts es genug davon), kanns tu eben auch 500.000 CPUs pro Generation bequem absetzen, aber mit hoher Wahrscheinlichkeit steht da kein einziger Rechner mit >10k CPUs.

Nur leider verkauft AMD nicht so viele CPUs und die Margen sind teils noch höher als 1000€.

Die derzeit teuerste AMD-CPU wird für 1050 € verkauft. Wenn sie damit eine Marge >1000 € machen: Respekt.

Insgesamt ist das Servergeschäft ziemlichlukrativ, ein Grund warum AMD und AMD/ATi so wenig Gewinn machen, weil sie da schlecht aufgestellt sind. nVidias Milliarde pro Quartal kommt nicht von ungefähr.[/QUOTE]

Nvidia macht gerade mal 1/5tel des Umsatzes mit der Profi-Sparte und die dürfte primär Quaddros verkaufen. Zum Vergleich: Tegra allein mach 167 Millionen und damit sicherlich mehr, als Tesla.



Die Tools fürs Placing und Routing sind aber nicht wirklich super was die Skalierung angeht.

Ich rede hier aber von Konstruktion, nicht von Routing. Bevor du was routest (das da mitlerweile wieder Handarbeit "in" ist, ist mir bekannt), solltest du erstmal prüfen, ob dein Konzept überhaupt funktioniert. Und dazu simulierst du erstmal die gesamte Struktur und testest, wie gut sie rechnet. Wenn die Leistung stimmt, dann kannst du ein finales Layout machen (btw.: Aufgrund von Spezialisierungen sitzen natürlich so schon ein paar Leute und machen sich Gedanken). Afaik ist man mitlerweile simulationstechnisch sogar schon so weit, dass zumindest Teile der Schaltungen noch einmal in einer physikalischen Simulation auf mögliche Interaktionen in Folge zu engen Routings überprüfen kann, ehe man ins Silizium gehen muss. (aber k.A., ob das eher theoretisch machbar oder praktisch sinnvoll ist)

Da sitzt du an einem relativ "kleinen" Chip mit ner wirklich großen SMP Maschine schon nen guten Tag dran.

Bei 1-2 Kernen kann man es sich erlauben, mal eine Woche rechnen zu lassen ;)

Das Problem ist ja ~NP-äqzuvalent (oder wars sogar NP-Vollständig?) Schau einfach nach Traveling Salesman Problem, dann siehst du was ich meine.

Die Skalierung ist, in Bezug auf die meisten Eckdaten, aber eine andere. Ob ich 16 KiB oder 16 MiB Cache verlegen muss - aufgrund der Selbstähnlichkeit steigt der Aufwand nicht sonderlich. Da die ganzen CPUs modular ausgelegt sind, wiederholen sich auch Kerne, Controller,... -> man keine einzelne Stücke optimieren und jedes davon ist "nur" ein paar dutzend Millionen Transistoren groß oder eben extrem repetitiv.

Naja, und am Anfang sitzt du daher eben schon mit "Blatt und Bleistift" da und denkst dir aus, wie etwas funktionieren soll.

Natürlich machst du das ganz am Anfang. Es ging hier aber nicht "um am Anfang", sondern es ging um "bevor in Silizium". "Am Anfang" dürfte im Falle von BD seit 3-4 Jahren vorbei sein und die sind nicht seitdem damit beschäftigt, alle paar Wochen einen neuen Chip zu fertigen und ihn dann in die Tonne zu treten.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Ruyven, ohne Placement und Routing kannst du deine Konstruktion aber gleich in die Tonne kloppen, weil du nicht wirklich sagen kannst, wie schnell das wird. Klar kann man gewissen Aussagen treffen wie: 5 Pipelinestufen erlauben einen niedrigeren Takt als 10, aber danach wirds schon schwierig. Daher muss man sich ja vorher ziemliche Dedanken drüber machen, was man will, und wo es hin gehen soll, und dann schauen, was man davon wirklich ins Silizium gepresst bekommt, wenn man die ganzen Teile zusammen fügt.

Bzgl.: Cache, klar, der Cache ist ja auch lächerlich, das wiederholt sich, wie du schon richtig gesagt hast immer. Da werden ja auch wirklich noch Leute ran gesetzt, die dir das Ding komplett von Hand entwerfen. :ugly: Der Mensch hat da doch ein anderes Auge für als ein PC mit irgendwelchen Algorithmen.

An so etwas habe ich aber auch gar nicht gedacht, sondern eher an die Interconnects zwischen den Cores<->Cache, sowie Ram-Controller an sich, Northbridge an sich, und die Cores eben an sich. Gerade die Cores an sich sollten zusammen mit dem onDIE-Interconnect die größten Knackpunkte sein, wo man wirklich massig Leistung rausholen, aber auch verschenken kann.

So kurz vor Schluss wie jetzt hast du aber recht, da sitzt man wirklich nur noch am Rechner und wirft halt Layouts in den Simulator und hofft doch noch einen höheren Takt zu finden, oder weniger Fläche zu brauchen. Mit 1-2 Kernen ist es da aber, wie du sagst bei weitem nicht getan. Also bei uns in der Uni läuft dafür wohl ein 48/64 Core Opteron System mit rund 1TB Ram, wenn ich es gerade richtig im Kopf habe :ugly:. Und das Ding rödelt ne ganze Nacht um einmal die Sache auf den FPGA zu werfen, und dabei lässt man das nicht ganz durch laufen, sondern bricht halt mehr oder weniger schnell ab. Man sollte die Sache WIRKLICH nicht unterschätzen. Selbst 100k oder gar 1 Mio Transistoren können da schon wirklich extrem sein. Das ist halt einer der ganz großen FPGAs, und ist so zu 98% oder so voll. Klar das machts nicht einfacher, aber bei einem ASIC hast du halt noch mehr Freiheitsgrade. Wie lang Sie da brauchen haben Sie gar nicht gesagt. Ich wills aber auch ehrlich gesagt gar nicht wissen.... Man kann da locker ne Menge Rechenleistung drin versenken, ohne Garantie, das da auch am Ende was besseres bei raus kommt.

So trivial und vor allem "schnell" ist das halt nicht mehr gemacht, und da reden wir wirklich von mehreren Stunden oder gar Tagen. Ich bekomm ja schon das große Kotzen, wenn ich aktuell so rund 20-90min aufs compilieren warten muss..... :daumen2: Das ist MEGA toll, wenn dann am Ende ein NICHTS sagender Compile-Error raus kommt :wall:

So kann man echt verdammt schnell einen Arbeitstag durch bringen...:schief:
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Nein, meine ich eben nicht ;)
In einem Städtischen Gebiet mit 5 Millionen Einwohnern (und weltweit gibts es genug davon), kanns tu eben auch 500.000 CPUs pro Generation bequem absetzen, aber mit hoher Wahrscheinlichkeit steht da kein einziger Rechner mit >10k CPUs.

Hä, aber dann sind deine Zahlen Quatsch.

Denn für Server rechnest du 100*1000*50.000
Und für PCs rechnest du 100*1000*500.000

Natürlich macht dann die Serversparte nur 1/10 des Gewinns von den PCs. Das sind ja völlig aus der Luft gegriffene Zahlen. Oder willst du sagen, dass man von den PCs 10 mal mehr verkauft?




Fakt ist aber doch , dass es AMD extrem gut tun würde im Servergeschäft die CPUs die sonst 200€ kosten für 1000€ (übertriebene Zahlen) zu verhökern und das halt mal im größeren Stil. Sieht man ja auch an den Margen, AMD hat 45% und Intel über 60% und dabei haben sie noch mehr Stückzahlen. Das wär einfach mal ein guter Gewinnbringer, denn schwarze Zahlen sind bei AMD leider keine Selbstverständlichkeit.

Und allgemein würd ich auch alles daran setzen, dass selbe Produkt einfach teurer zu verkaufen. Man hat den selben Aufwand, kriegt aber mehr Geld. Dieses Geschäft MUSS man als Unternehmer doch ausbauen. Und hier hat AMD halt ziemlich schlechte Karten, weil wenn ein Intel bei gleichem Stromverbrauch 20% mehr leistet, dann wird der gekauft. Mag er 100€ teurer sein, das spielen Strom und Speed wieder ein.


Nvidia macht gerade mal 1/5tel des Umsatzes mit der Profi-Sparte und die dürfte primär Quaddros verkaufen. Zum Vergleich: Tegra allein mach 167 Millionen und damit sicherlich mehr, als Tesla.

Nope, die Profisparte erwirtschaftetete 210 Mio. Dollar. Zum Vergleich, die Grafiksparte von AMD hatte einen Gesamtumsatz von nur 350 Mio. Dollar. Würden sie im Profimarkt auch so aktiv sein, hätten sie die 500 bestimmt geknackt und das ist doch mal ne ordentliche Steigerung.
 
Zuletzt bearbeitet:
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Manche Leute, ich z.B., können durchaus unterscheiden zwischen AMD und ATI (ATI:Kurzfassung von "AMDs Grafiksparte").
Ich verwende einige AMD CPUs, aber ne ATI käme mir nie in die Kiste.
Der Kollege mit dem ATI-Nick sieht das wohl genau andersrum.
Ähem, mit Kiste meine ich natürlich meinen Rechner.

GF ist nicht direkt von den Einnahmen von AMD abhängig:
1. Fertigen sie auch für andere
2. Kriegen sie massig Geld von arabischen Investoren

Die Aussage verstehe ich nicht.

Erstens geht es hier um AMD, nicht um GF, zweitens kriegt GF das Geld der arabischen Investoren nur dann, wenn es dadurch
vermehrt wird.
 
Zuletzt bearbeitet von einem Moderator:
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Was ein sinnfreies Kindergequatsche hier. :schief: Ich spiele weder PI noch Cinebench. Das einziege was für mich intreresant ist, sind Benches von Games. Da liegt der X6 jetzt schon preislich und Leistungsmäßig nicht schlecht und wenn der Bulli da noch was drauflegt, ist er prefekt für mich. Davon ab interesiert es mich wehnig, wer welchen Hersteller gut findet. :schief: Sie bescheißen beide und mit beiden kann man alles machen und alle sind Leistungfähig.

PS: dann werden wohl die Preise der FX in Richtung I7-2600 gehen. Hoffentlich etwas drunter :D
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Was ein sinnfreies Kindergequatsche hier. :schief: Ich spiele weder PI noch Cinebench. Das einziege was für mich intreresant ist, sind Benches von Games. Da liegt der X6 jetzt schon preislich und Leistungsmäßig nicht schlecht und wenn der Bulli da noch was drauflegt, ist er prefekt für mich. Davon ab interesiert es mich wehnig, wer welchen Hersteller gut findet. :schief: Sie bescheißen beide und mit beiden kann man alles machen und alle sind Leistungfähig.

PS: dann werden wohl die Preise der FX in Richtung I7-2600 gehen. Hoffentlich etwas drunter :D

Dem kann ich zustimmen, was hauptsächlich zählt ist für mich die gaming-performance.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Was ein sinnfreies Kindergequatsche hier. Ich spiele weder PI noch Cinebench. Das einziege was für mich intreresant ist, sind Benches von Games. Da liegt der X6 jetzt schon preislich und Leistungsmäßig nicht schlecht und wenn der Bulli da noch was drauflegt, ist er prefekt für mich.

Demnach ist der BD erst interessant für dich wenn er 140€ Kostet, bei alles andere wäre dein Post auch(ehm) Kindergequatsche (wenn die Benches so stimmen wie in der News)
Wenn der Bulldoser mit 4,2ghz nur so schnell ist wie ein x6 mit 4ghz dann braucht AMD den erst garnicht zu lounchen, dann können sie den stecken lassen (können sie gleich in Asien lassen und spaaren die Überführungskosten);)
 
Zurück