skip to main content

kiesler.at

Lexikalische Analyse mit Lex
updated by rck, 2004-08-27

In Unix finden sich viele Spezialisten. cat gibt dateien aus, cut zerschneidet sie spaltenweise, paste fügt sie wieder zusammen... und lex macht aus einer Text-Datei Tokens.
1 | 2 | 3 | 4 | 5 | 6

Reguläre Ausdrücke

Hmmm. Ist das wirklich alles, was grep kann? Nein, nicht ganz. grep ist die Abkürzung für "global regular expression print" und eigentlich Teil von sed. Wieder eine Geschichte für sich

Regular Expressions, oder Reguläre Ausdrücke, wie sie auf Deutsch heißen, sind eine sehr mächtige Sache. Zurück zu unserem Text. Was machen Sie, wenn Sie sowohl nach Kugel, als auch nach Kugeln suchen wollen? Sicher, Sie können grep zwei Mal aufrufen und sehen, was passiert.

Doch Sie könnten genauso nach dem Regulären Ausdruck 'Kugeln\?' suchen. Heißt soviel wie: Ich suche nach "Kugel", möglicherweise (=\?) kommt auch ein n dannach (=n\?).

Weitere Features

Neben '\?' gibt's dann auch noch '\+' und '\*'. + heißt: zumindest ein, wenn nicht mehrere. * heißt: beliebig viele, ist also die Kombination aus ? und +.

Die besondere Mächtigkeit von regulären Ausdrücken verdanken sie allerdings einer weiteren Eigenschaft: Der Zeichenangabe. Der schlichte . steht für ein beliebiges Zeichen. Möchte man nur a, b und c referenzieren, gibt man diese in eckige Klammern [abc]. Will man einen ganzen Zeichenbereich, gibt man diesen beispielsweise mit [a-z] an. Mehrere mit [a-zA-Z0-9] und so weiter.

1 | 2 | 3 | 4 | 5 | 6



RSSComments - Make a comment
The comments are owned by the poster. We are not responsible for its content.
RSSAll Articles
2008, 2007, 2006, 2005, 2004