Bestimmte Textbausteine aus einer PDF extrahieren

FkAh

Volt-Modder(in)
Servus,

ich habe bei eBay nach einem Artikel gesuchtund die je 8 Seiten mit je 200 Angeboten als "PDF gedruckt" und zu einer großen PDF zusammengefügt, 145 Seiten.
Mich interessieren im Moment nur die Abschnitte wo steht "Verkäufer: xyz".

Meine Frage ist nun ob es möglich ist aus dieser PDF automatisch oder halt mit ein paar Klicks diese Informationen zu extrahieren, also für alle 1517 Angebote jeweils den Verkäufernamen, und sie zu speichern.
Über Tools, die auf die eBay API zugreifen, bekomme ich diese Infos auch, aber die "gedruckte Seite" als PDF brauch ich anderweitig und wenn ich es so realisieren könnte, wäre es praktischer.

Machbar ist es sicherlich, da ich auf einige Ansätze beim Suchen gestoßen sind, aber mit Programmieren kenne ich mich leider absolut gar nicht aus.

Mal sehen ob einer von euch ne Idee hat. Am nächsten bin ich meinem Ziel mit UltraEdit gekommen nachdem ich die PDF als txt gespeichert habe. Problem dabei war, dass ich nur ganze Zeilen hab kopieren können und somit weiterhin das Problem habe nicht nur den Verkäufernamen einzeln zu haben. Abgesehen davon fehlt die Hälfte der Daten nach abspeichern als txt..

Grüße und schonmal Danke

EDIT: Ach Murks jetzt hab ichs ins falsche Unterforum gepackt. Kann ein Mod das bitte nach tools-anwendungen-und-sicherheit verschieben? :)
 
Zurück