Archiv der Kategorie: Vergleichen, Sortieren

split

Große Dateien aufteilen: split -b 1440k QuellDatei BasisName
Mit -b gibt man an, dass die Datei nicht zeilenweise sondern byteweise betrachtet werden soll.
1440k bestimmt die Größe der einzelnen aufgeteilten Dateien.
QuellName ist natürlich der Name der aufzuteilenden Datei und
BasisName ist der Name der als ,Basis‘ für die Namen der erzeugten kleineren Dateien verwendet wird. Um eine derart aufgeteilte Datei später wieder zusammenzusetzen verwendet man den ,cat‘ Befehl: cat BasisName* > NamederZieldatei

recode

ändert die Zeichenkodierung des Dateinamens
recode quellcode..zielcode datei
recode ibmpc..lat1 datei konvertiert von DOS nach UNIX
Zeichensätze:

  • ISO-8859-1 ohne Euro
  • ISO-8859-15 mit Euro
  • UTF8 universeller Zeichensatz
  • windows-1252
  • cp1252
  • cp850
  • codepage=850

Der Dateininhalt wird mit iconv konvertiert

tr

Zeichen in Dateien ersetzen

Option Bedeutung
-d Entfernt die Zeichen in Satz1 aus der Zeichenfolge
-s Entfernt mehrfache Vorkommen der Zeichen in Satz1
-c Ersetzt die Zeichen, die nicht in Satz1 vorkommen

Beispiele:
cat file1 | tr altes_Wort neues_Wort > NeueDatei

tr -d ':' < /etc/passwd 
liest /etc/passwd und entfernt aus diesem Zeichenstrom alle Doppelpunkte.

tr -s '\n' 
ersetzt doppelte oder mehrfache Leerzeilen durch eine einzige.

tr "\n" " " < dateiname > neue_datei 
löscht alle Zeilenumbrüche

tr [:lower:] [:upper:]
ersetzt alle Kleinbuchstaben aus der Standardeingabe durch Großbuchstaben und gibt das Ergebnis auf der Standardausgabe aus.

diff

diff datei1 datei2 Vergleichen von zwei Textdateien
sdiff datei1 datei2 Vergleichen von zwei Textdateien nebeneinander
diff -r /verzeichnis1/ /verzeichnis2/ vergleicht zwei Verzeichnisse rekursiv
diff -rq /verzeichnis1/ /verzeichnis2/ vergleicht zwei Verzeichnisse rekursiv und gibt nur die Verzeichnisnamen aus