Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

MR_Ziggy_Zag

Komplett-PC-Käufer(in)
Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

Hallo Community,

ich habe eine Notepad-Datei.
Dort habe ich fast 500 verschiedene Nachrichten reinkopiert.
Vor den Nachrichten erscheint aber immer wieder der selbe unnötige Hinweistext, welchen ich gerne löschen möchte.
Nun habe ich keine Lust dies 500x zu tun und würde gerne wissen, ob ihr einen Tipp habt, wie ich den immer wieder gleichen Text in einem Rutsch löschen kann.
Habt vielen Dank!

Der Ziggy
 
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

Jedes gängige Textbearbeitungsprogramm bietet eine Funktion "Suchen und ersetzen" an. Wenn du nach dem Hinweistext suchst und durch "" (also nichts) ersetzt, müsste das hinhauen. Du musst nur schauen, ob da dann vielleicht doppelte Leerzeichen oder sowas zurückbleiben.

MfG Jimini
 
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

bei notepod such und ersetzen nutzen und einfach bei der Suche die wiederholenden Zeilen eintragen, ersetzen durch "nixx eintragen", suchen und ersetzen starten fertig! da is nixx doppelt nixx mit leerzeichen zugekleistert oder umbrüchen....
 
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

da is nixx doppelt nixx mit leerzeichen zugekleistert oder umbrüchen....
Du weißt ja nicht, wie der zu löschende Text aussieht. Wenn der von Leerzeichen und / oder Umbrüchen umgeben ist, du aber nur den Text löschst, dann bleiben logischerweise Leerzeich und / oder Umbrüche übrig.

MfG Jimini
 
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

Gelöst - mit eurer Hilfe!
Ich danke euch!!!

In Notepad gibt es unter "Bearbeiten" den Befehl "Ersetzen"!
Dort kann man unter "Suchen nach" das jeweilige Wort bzw. die jeweilige Wortgruppe eintragen und auf "Alle ersetzen" klicken.
Dann werden betroffene Wörter oder Wortgruppen gelöscht.
Alternativ gibt es auch die Möglichkeit die Begriffe durch andere auszutauschen ("Ersetzen durch")...

Tipp:
Um überflüssige Leerzeichen, Tabs o.ä. zu vermeiden müssen diese natürlich auch im Dialogfeld "Suchen nach" mit eingetragen werden.

NOCHMALS DANKE LEUTE!
Ziggy
 
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

Musst mit Regulären Ausdrücken arbeiten. Nodepad++ freeware kann das zum Beispiel.

Hier die Steuerzeichen dafür und Anwendungsbeispiele drunter

Code:
^ Matches the beginning of a line.  
$ Matches the end of a line.  
* Repeats the previous expression 0 or more times.  
+ Repeats the previous expression 1 or more times. 
? Repeats the previous expression 0 or 1 time.  
{n} Repeats the previous expression exactly n-times.  
{n,m} Repeats the previous expression at least n, but at most m times. 
{n, } Repeats the previous expression at least n-times. 
 . Matches every character except new line [^\n]  
(x) Used for grouping expressions. Later you can reference them by  \NoOfTaggedExpression  
x|y Matches x or y. So e.g. apple|orange will match apple or orange 
[abc] Matches all characters enumerated between the square brackets.E.g.  [0-9a-zA-Z] matches all alphanumeric characters.  
[^abc] Matches none of the enumerated characters.  
\d A decimal character. Equivalent with [0-9]  
\D Every character that is not decimal (Equivalent with [^0-9] )  
\n New line character  
\s Space characters [ \f\n\r\t\v]. 
\S Everything that is not treated as a space.  
\t Tabulator character 
\w Characters found in variables [0-9a-zA-Z_].  
\W Opposite of \w 
\1 or \2 ... Reference to Tagged expressions. 
\0 means the entire matched pattern while  
\1 means the first tagged expression and so on. One restriction: You cannot use  them in find operations: They can be referenced in a replace operations.  
\hexa Identifier of an ASCII character. E.g. \x4D represents the ‘M’ letter.
Code:
\w+                      a whole word
/^.*/m                   an entire line
/^#\w+/m                 a C preprocessor directive
[A-C]\w+                 all words that start with "A" or "B" or "C"
a{1,2}                   matches "a", "aa", but doesn’t match "aaa"
/^$/m                    every empty line.
/^#.*$/m                 lines that start with #
/b$/m                    lines that end with letter b
http://(.+)/.*$/m        getting the domain name from the url.
                         ($1 will store the domain name after the match)
/^http://(.+)/.*$/m      same as above but the matching url must be in a separate line
[a-zA-Z.-]+@[a-zA-Z.-]+  checking for a valid email
                         (note here that it still matches ..@.. or ..@aaa that are not
                         valid emails. Possible you can filter them out in one complex regexp,
                         but it is much more easier to filter them out in two or more regexps.
                         So always try to find the easiest possible solution!)
/<b>.*</b>/miUs          This one will find all the bold-elements in an html file. Note the U switch.
                         try it without the switch to see the difference!
P.S. wichtig die Steuerzeichen müssen immer mit einem Back Slash versehnen werden wenn sie als Zeichen gemeint sind. Z.B. wenn text '\n' Suchmuster ist dann '\\n' um die Steuerzeichenfunktion als simples Zeichen zu erkennen. Noch ein Tip unter Windows ist das Muster für 'Zeilenende Zeilenanfang' '\n\s+^' Würde schneller gehen aber ist dann nicht mehr unfehlbar.

Mustersuche funktioniert binär bedingt schnell aber für codierte Werte, wie string, existiert keine schnellere Suchfunktion. Alle Programmiersprachen besitzen die Funktion und verwenden übergreifend die gleiche Syntax im Suchmuster. Die Funktion ist nur dann hochperformant, wenn das Muster möglichst eindeutig dem Suchziel enspricht. Z.B. '.+arsch' man weis nicht was für Zeichen und wie wieviele man davon findet bis man nichts mehr findet was nicht dem Muster 'arsch' gleicht.
 
Zuletzt bearbeitet:
AW: Wiederholende Passagen in einem txt.-Dokument auf einmal löschen

Wozu mit dem Ungeheuer namens Regex anfangen, wenn die Option in (meines Wissens) jedem gängigen Textverarbeitungsprogramm so einfach gestaltet ist, dass man die zu ersetzende Passage im Klartext eingibt und ersetzen lässt? Selbst wenn da ein Zeilenumbruch oder sowas drin wäre, wäre man mit ein paar zusätzlichen Klicks (zuerst Wortgruppe A ersetzen lassen, dann Wortgruppe B, dann C) doch wesentlich schneller dran. Sonst kann man auch gleich sed auspacken ;)

MfG Jimini
 
Zurück