Nein, werde ich nicht - ich arbeite gelegentlich tatsächlich mit solchen Systemen und benche nicht nur rum. Da fällt dir sowas automatisch auf.
Fakt ist: Wenn du ein System aus zwei Xeons auf zwei Sockeln hast und du transcodierst beispielsweise zwei Videos gleichzeitig in den HEVC10 dann wird das System merklich schneller, wenn du die Kodierung 1 manuell auf die Threads der ersten CPU schiebst und gleiches mit Kodierung 2 auf CPU 2 tust.
Dürfen beide Prozesse beide CPUs nutzen kostet das Performance weil ständig Daten von CPU a nach B hin und hergeschoben werden müssen. Dafür muss dieser "Schiebeprozess" nicht besonders viel langsamer sein, aber wenn du bei jedem Transfer ein paar Taktzyklen verlierst weil die Latenzen nunmal größer sind als direkt von RAM zur CPU wird deine Leistung nunmal schlechter.
Das kannste mir nun als jemand der das seit Jahren praktisch nutzt glauben oder du kannst die typische Internetmentalität weiter verfolgen und warten bis sich jemand aus dem Bereich die Mühe macht das auf bunten Benchmarkbildchen aufzumalen (das wird tendentiell eher nicht passieren da Leute die sowas machen das ohnehin wissen und jeder bessere Bediener eines solchen Systems sowieso Threads manuell zuweist).
Was natürlich stimmt ist dass ein 2-Sockel-System Vorteile hat wenn die verwendeten CPUs aufgrund der viel höheren Powerlimitierung (2x130W sind nunmal mehr als 1x165W beispielsweise) weitaus höher takten können als ein 16-Kerner. Das erschlägt das andere Problem in der Regel problemlos. Es ging aber wie ich es verstanden habe ja um gleichwertige CPUs und nur um den systembedingten Unterschied.
Auch ist es natürlich extrem von Workload und Software abhängig. Ich kenns nur von Videokompression und von der Arbeit mit extremen Datenbanken. Wies mit CFD aussieht weiß ich nicht.