x87-Hack: Sind AMDs Prozessoren doch schneller? Usernews von Olstyle

Ich find das sinnlos weils anscheinend ausschließlich wirklich was in super pi bringt und so wirkt als würde man schummeln, ka kanns nicht genau erklären es wirkt halt falsch und nutzlos.

Es ist kein Schummeln, sondern wirklich die Deaktivierung eines Funktion.
Genauere Tests und Erkenntnisse kannst du bei HWBot entnehmen (bzw. Googeln).
Was bis dato ich bei meiner Rescher-sche nicht finden konnte, ob es auch weitere
Programme/Anwendungen gibt, die davon profitieren (außer bereits bekannten PhysikX).
 
Wohl herzlich wenig, weil der Code meines wissens heutzutage kaum mehr in games verwendet wird. Allerdings wären Benchmarks interessant, kann ja sein dass ich mich irre ;)

TL;DR
In aktuellen Anwendungen spielt x87 üblicherweise keine Rolle mehr (SuperPI zählt nicht als aktuell). Die unrühmliche Ausnahme ist hier Nvidias PhysX.

Stimmt schon so. Die beschleunigten x87-Instruktionen wurden weitestgehend von moderneren und schnelleren SSE-Instruktionen abgelöst. Nur bei sehr mathematiklastigen Anwendungen macht es selten noch Sinn x87 zu nutzen. In den allermeisten Fällen ist man aber mit SSE bzw. AVX besser dran. SuperPI ist schon lange nicht mehr aktuell und hat mit realen Anwendungen so gut wie nichts zu tun. Aktuelle Anwendungen verwenden üblicherweise gar keine x87-Instruktionen mehr. Intel und AMD weisen auch seit über 10 Jahren darauf hin, dass SSE zu bevorzugen ist.

Die Verwendung von x87 in PhysX wurde vor 3 Jahren bekannt. Experten haben sich darüber sehr gewundert. Der Aufwand x87 durch SSE oder AVX zu ersetzen wäre relativ gering und brächte einen enormen Performaceboost für die PC-Version. Es scheint so, als würde Nvidia die PC-Version von PhysX absichtlich nicht optimieren. Das sieht man auch daran, dass die PowerPC-Version (xbox 360) die sogenennten AltiVec-Instruktionen verwendent, welche SSE sehr ähnlich sind. Wer es ganz genau wissen will, darf die komplette PhysX analyse lesen: PhysX87: Software Deficiency. Diese Analyse ist 3 Jahre alt. Nach der Veröffentlichung gab Nvidia bekannt, man wolle im PhysX SDK SSE zur Voreinstellung machen.
 
Zuletzt bearbeitet:
Es ist kein Schummeln, sondern wirklich die Deaktivierung eines Funktion.
Genauere Tests und Erkenntnisse kannst du bei HWBot entnehmen (bzw. Googeln).
Was bis dato ich bei meiner Rescher-sche nicht finden konnte, ob es auch weitere
Programme/Anwendungen gibt, die davon profitieren (außer bereits bekannten PhysikX).
Ist doch eigentlich die Aktivierung einer Funktion :what:

Ich hoffe, dass ich damit ohne oc mit meinem alten 6100 an den 6300 oder so drankomme...
Mit oc wirds dann evtl. In Richtung 8150 gehen?
Ich kenne mich da noch nicht so aus
2 Kerne lassen sich leider nicht durch Takt ersetzten.
 
Nach Google'n:

Verbesserungen zu erwarten bei:

1. AIDA64 - Gleitkommaberechnung (Wiki: Für Gleitkommaoperationen ist zwar aus Kompatibilitätsgründen eine x87-FPU auf dem Prozessor vorhanden. Der Hersteller empfiehlt jedoch, für Gleitkommaberechnungen generell nur noch die performantere und problemärmere SSE-Einheit zu benutzen. Problematisch ist hierbei allerdings, dass die SSE-Einheit bis heute keine transzendenten Funktionen (Sinus, Cosinus, Arcustangens, Logarithmus) beherrscht; diese müssen weiterhin über die x87-FPU berechnet oder per Software emuliert werden. Außerdem beherrscht die SSE-Einheit nur 64-Bit-Gleitkommaarithmetik, während die x87-FPU-Einheit intern mit 80-Bit-Gleitkommaarithmetik arbeitet. )
somit u.U. alle Gleitkomma-basierte Algorithmen
2. PhysiX (bereits bekannt) hier aber der Hintergrund: CPU-PhysX: Die x87-Story - PhysX: Lust, Last oder Frust? Analyse und Anleitung für ATI-Benutzer
3... auf der Suche



EDIT:
Ist doch eigentlich die Aktivierung einer Funktion :what:
Aktivierung des 87 Befehlsatzes durch die Deaktivierung des 87-ers Blockfunktion (siehe Screenshots: disable = deaktiviert).
 
Zuletzt bearbeitet:
:)Hab mal schnell was getestet.
 

Anhänge

  • Disabled.JPG
    Disabled.JPG
    108,9 KB · Aufrufe: 350
  • Enabled.JPG
    Enabled.JPG
    108,9 KB · Aufrufe: 347
  • Disabled1.JPG
    Disabled1.JPG
    155 KB · Aufrufe: 347
  • Enabled1.JPG
    Enabled1.JPG
    155,3 KB · Aufrufe: 345
  • Disabled2.JPG
    Disabled2.JPG
    140,7 KB · Aufrufe: 292
  • Enabled2.JPG
    Enabled2.JPG
    140,3 KB · Aufrufe: 282
Hmm - Verluste im 3D Mark. Können andere das bestätigen

Ansonten:
Gibts eigentlich irgendwelche Stabilitätstests, die gezielt x87 nutzen? Und wenn ja: Hat sie schon jemand laufen lassen?
Und wie siehts eigentlich mit älteren CPUs aus? AMDs x87 Schwäche ist mindestens so alt, wie der Athlon XP.
 
Hmm - Verluste im 3D Mark. Können andere das bestätigen

Genau kucken: 11punkte mehr hat er im 3D Mark; im Cenebench allerdings 0,03 Punkte weniger. (Nicht vergessen dass der Patch bei disabled ON ist und umgekehrt ;))

Beides könnte aber genauso gut am Turbo liegen imo denn die Abweichung liegt ja schin im Bereich der Messtoleranz

Bei Mafia 2 Physx auf hoch .

Enabled 10,2

Disabled 10,6

Das ist ein völlig neues Spielerlebnis.

Immerhin 4%. ist jetzt nicht die Welt aber ungefähr schon mal fast halb so viel wie Intel mit Haswell gegenüber Ivy gewonnen hat :devil:
 
Hmm - Verluste im 3D Mark. Können andere das bestätigen

Ansonten:
Gibts eigentlich irgendwelche Stabilitätstests, die gezielt x87 nutzen? Und wenn ja: Hat sie schon jemand laufen lassen?
Und wie siehts eigentlich mit älteren CPUs aus? AMDs x87 Schwäche ist mindestens so alt, wie der Athlon XP.
Also gerade der Athlon war in x87 immer recht stark - erst gegenüber dem P3 und erst recht gegenüber dem P4.
 
Zuletzt bearbeitet:
Der Athlon gegenüber dem PIII iirc ja - aber der SSE-orientierte XP gegenüber dem P4?
Iirc lagen die Pentium 4 lange Zeit meilenweit (so Faktor 2) vor AMD, was Super Pi anging.
 
Der Athlon gegenüber dem PIII iirc ja - aber der SSE-orientierte XP gegenüber dem P4?
Iirc lagen die Pentium 4 lange Zeit meilenweit (so Faktor 2) vor AMD, was Super Pi anging.
An der FPU hat AMD nichts geändert. IIRC hat sogar der A64 noch in Grundzügen dasselbe Design. Das wurde erst beim Phenom gekickt.

Welchen Code SuperPI nun genau nutzt, weiß ich nicht. Aber wenn die Programmschleife klein genug ist, kann durchaus auch das Caching eine große Rolle spielen, eventuell sogar der Trace-Cache des P4.

Edit:
Auf Anhieb hab ich nur das hier gefunden: So ab Platz 95 kommen die "unmodernen" CPUs.
http://forums.guru3d.com/showthread.php?t=185163
 
Zuletzt bearbeitet:
Gerade nochmal Mafia 2 gebencht mit 5000 MHz

Enabled 13,6

Disabled 13,9

Leider ist der Benchablauf nicht immer genau gleich weshalb das auch Messtolerazen gibt z.b egal ob an oder aus, hatte ich mit beiden Einstellungen 13,1 fps .

Die Ergebnisse oben waren jetzt die besten.

Bei super pi bringt das schon mehr .


Bei Standard Takt: Disabled 18,8 / Enabled 22,3

Mit 5000MHz: Disabled 15,4 / Enabled 18,3

Mit 5380MHz: Disabled 14,4 / Enabled 17,2
 
Zuletzt bearbeitet:
Zurück