DarkMo
Lötkolbengott/-göttin
microruckeln - wieso ist eine lösung so schwer?
also das thema gibts ja nun schon etwas länger. nv hats wohl einigermaßen im griff, ati schwächelt hier. aber wieso gibts da keine guten lösungen?
das kernproblem liegt ja darin begraben, das mehrere karten mehrere bilder parallel berechnen und eben nicht gleichmäßig ausgeben. selbst wenn man einigermaßen synchron starten könnte, kann diese synchronität schlecht bis garnicht aufrecht erhalten werden.
aber wieso berechnen nich einfach beide das selbe bild? ihr kennt och sicher dieses cinebench, wo die cpu das motorad bild rendert. jeder kern startet an einer anderen position (x=0, y=CoreNr*YMax/CoreZahl) undb erechnet zeile für zeile. hat einer seinen bereich beendet, so wird der größte restbereich gesucht, und in desen mitte angefangen und somit der andere kern unterstützt.
wieso geht das bei en gpu's nich? ich denke mal, wenn es ginge, würden sies schon so machen ^^ sinds die verteilten ressourcen? also eben das jede gpu ihren eignen ram hat? aber die haben ja auch jetz schon die selben daten im ram - also gleiche ausgangslage, nur eben bei 2en nur halb soviel zu berechnen damit. an den ausgangsdaten sollte sich ja eigentlich nix ändern, womit für mein verständnis dieses problem hinfällig wäre. also auch wenn die ressourcen verteilt sind, so haben alle karten das selbe grundlagen material um ihren jeweiligen part zu machen.
bliebe höchstens die kommunikation, wo die berechnung grad steckt. also dass man die restbereiche da ermitteln kann, um diese mit zu bearbeiten. aber das sollten ja minimale größen sein, im byte bereich oder wenige bits. das sollte doch auch kein problem darstellen oder?
aber vllt weis ja einer von euch nen bissl mehr über die thematik, wieso sie diesen quark mit "jede ihr eigenes bild" un ned "alle an einem" nutzen. bin gespannt auf die diskussion
also das thema gibts ja nun schon etwas länger. nv hats wohl einigermaßen im griff, ati schwächelt hier. aber wieso gibts da keine guten lösungen?
das kernproblem liegt ja darin begraben, das mehrere karten mehrere bilder parallel berechnen und eben nicht gleichmäßig ausgeben. selbst wenn man einigermaßen synchron starten könnte, kann diese synchronität schlecht bis garnicht aufrecht erhalten werden.
aber wieso berechnen nich einfach beide das selbe bild? ihr kennt och sicher dieses cinebench, wo die cpu das motorad bild rendert. jeder kern startet an einer anderen position (x=0, y=CoreNr*YMax/CoreZahl) undb erechnet zeile für zeile. hat einer seinen bereich beendet, so wird der größte restbereich gesucht, und in desen mitte angefangen und somit der andere kern unterstützt.
wieso geht das bei en gpu's nich? ich denke mal, wenn es ginge, würden sies schon so machen ^^ sinds die verteilten ressourcen? also eben das jede gpu ihren eignen ram hat? aber die haben ja auch jetz schon die selben daten im ram - also gleiche ausgangslage, nur eben bei 2en nur halb soviel zu berechnen damit. an den ausgangsdaten sollte sich ja eigentlich nix ändern, womit für mein verständnis dieses problem hinfällig wäre. also auch wenn die ressourcen verteilt sind, so haben alle karten das selbe grundlagen material um ihren jeweiligen part zu machen.
bliebe höchstens die kommunikation, wo die berechnung grad steckt. also dass man die restbereiche da ermitteln kann, um diese mit zu bearbeiten. aber das sollten ja minimale größen sein, im byte bereich oder wenige bits. das sollte doch auch kein problem darstellen oder?
aber vllt weis ja einer von euch nen bissl mehr über die thematik, wieso sie diesen quark mit "jede ihr eigenes bild" un ned "alle an einem" nutzen. bin gespannt auf die diskussion






