Solche Erfassungen sind am Ende halt genauso aussagekräftig wie all die "repräsentativen Umfragen" von Tageszeitungen bei denen 100-1000 Personen zu einem Thema befragt werden und es am Ende heisst "So steht Deutschland zum Thema XY".
Man kann mit 1.000 Leuten durchaus repräsentative Umfragen zu den meisten Themen machen. Ist aber kein Selbstläufer, sondern erfordert einen Abgleich der Umfrageteilnehmer mit der Gesamtbevölkerung. Deswegen fragen dich professionelle Meinungsforscher immer nach Alter, Geschlecht, Familienstand, Wohnform, Einkommen und ähnlichem. Die wollen (nicht nur) diese zusätzlichen Daten abgreifen, sondern die wollen ermitteln zu welcher Bevölkerungsgruppe zu gehörst. In ein "So steht Deutschland"-Ergebnis fließt deine Antwort dann nur als Stichprobe innerhalb dieser Gruppe ein und wird mit der bekannten Gesamtgröße der Gruppe verrechnet: 20 Umfrageteilnehmer gehören Gruppe A an und geben alle Antwort X. 80 Umfrageteilnehmer gehören Gruppe B an und alle geben Antwort Y. Man weiß aber zum Beispiel aus Zensusdaten, dass 70 Prozent der Deutschen A'ler sind und 30 Prozent B'ler. Also lautet das repräsentativ gewichtete Umfrageergebenis nicht "20 Prozent sagen X, 80 Prozent sagen Y", sondern "70 Prozent X, 30 Prozent Y".
Das gut zu machen ist schon eine Kunst für sich – bei wichtigen politische Themen kann man erfassen, wen die Umfrageteilnehmer bei der letzten Bundestagswahl gewählt haben und so die politischen Lager gemäß offiziellem Wahlergebnis repräsentativ in Relation setzen. Aber bei Tippergebnissen für die nächste Fußball-WM, der Lieblingsfarbe oder Sommer- vs. Winterzeit wird es schwieriger. Valve scheint kurzerhand gar keine repräsentative Gewichtung vorzunehmen und haut einfach ungefilterte Gesamtergebnisse raus. Damit sind die Surveys nichts weiter als stark fluktuierende Online-Quickpolls, obwohl Steam eigentlich die perfekte Datengrundlage bietet.
Große Datenschutzvorbehalte mit Nachfrage hat man schließlich nur bei den Hardware-Umfragen. Die Software-Nutzung erfasst Valve dagegen permanent und weiß genau, wer wann was wie lange gespielt hat inklusive Durchschnittsstatistiken für die Gesamtheit aller Steam-Nutzer. Man könnte also einfach danach gewichten: Spielte der durchschnittliche Steam-Nutzer im März 2 Stunden Battlefield und 1 Stunde LoL? Unter den Umfrageteilnehmern ist das Verhältnis aber 0,5 h zu 5 h? Dann muss man die Antworten derjenigen, die Battlefield gespielt haben eben viermal stärker und die der LoL-Suchtis fünfmal schwächer gewichten, um sich dem Durchschnitt anzunähern. Mit hunderten populären Spielen, von denen die meisten Nutzer wenigstens ein Dutzend besitzen werden, könnte Valve ein ziemlich komplexes Netzwerk von Benutzergruppen definieren, deren absolute Anzahl jeweils bekannt ist, dann für jede einzelne davon die typischen Hardware-Konfigurationen erfragen und daraus eine repräsentative Verteilung berechnen.
Stattdessen ist man mit Geldzählen und Episode-3-nicht-entwickeln beschäftigt!