broepi.de

Startseite

Willkommen auf der Website von Danny Raufeisen

Was zu meiner Suchmaschine

9. April 2010 um 21.09 Uhr

Also schön, auf Anfrage von Peter hier nun ein kleiner in-depth look in die Suchmaschine auf dieser Seite. Es ist wirklich nichts besonderes und es gibt sicher noch einiges daran zu verbessern. ;-)

Das ganz funktioniert im Prinzip wie ein Crawler. Wird ein Suchauftrag nach einem String losgeschickt, dann verfolgt der Suchapparat auf meiner Homepage rekursiv alle Links und versucht dabei nicht die eigene Domain zu verlassen und nicht ein und dieselbe Seite zweimal zu durchsuchen. Jedes Dokument wird dann iterativ mithilfe von strpos() auf den Suchstring angewandt. Es wird dann ein Schnipsel des Dokumentes ausgespuckt, beginnend ab der von strpos() zurückgegebenen Position, Suchstring-Länge + 100 Zeichen lang. Dann wird dahinter im Dokument weiter gesucht bis strpos() FALSE zurückgibt.

Ich kann niemanden empfehlen, eine Suchmaschine so zu programmieren, wie ich es tat, denn mit zunehmenden Inhalt meiner Homepage, wird die Suche schnell zur Kaffeepause. Eine Verbesserung wäre, man lässt sich einmal im Monat oder nach jeder Änderung des Contents ein Array mit zu durchsuchenden Links erstellen und auf dem Webspace speichern. Dies kann durch einen Crawler übernommen werden. Die Suchmaschine selbst durchläuft dann nur das Array. Oder man integriert einfach Google. ;-)