Index Checker

10.05.2008 10:27:22 von Markus Kindler

Schon seit einiger Zeit ist hier auf der Seite ein Tool namens “Index Checker” zu finden, dass ich heute mal mit Hilfe eines Beispiels erklären und präsentieren will.

Zunächst: Was kann überhaupt dieses kleine Tool? - Nun, der Index Checker findet anhand einer XML Sitemap (ehemals Google Sitemap) oder einer URL Liste (bekannt von Yahoo), die Seiten aus der Sitemap, die nicht im Index von Google enthalten sind.

Schritt 1.1: XML Sitemap einpflegen
Wenn die eigene Sitemap als XML Sitemap vorhanden ist, muss man die Sitemap Datei zunächst mit dem Namen “sitemap.xml” in den gleichen Ordner kopieren, in dem sich auch die “Index Checker.exe” befindet.

Index Checker Ordner

Hiernach starten wir den Index Checker und sehen zwei Buttons und ein großes Textfeld vor uns.

Index Checker

Hier muss man nun auf den Button “Read XML Sitemap” (links oben) klicken und im Textfeld erscheint eine Liste mit allen URLs, die aus der Sitemap extrahiert werden konnten.

Sitemap im Index Checker

Schritt 1.2: URL Liste einpflegen
Sollte die Sitemap nicht als XML Sitemap, sondern als URL Liste (pro Zeile eine URL) vorliegen, wird die Sache noch einfacher. Hierbei muss man einfach nur den Index Checker starten und die Liste in das große Textfeld kopieren.

Schritt 2: Daten auswerten
Nun, wo die Sitemap im Programm ist, müssen wir nur noch die Auswertung über den Button “Index Check” (rechts oben) starten und einige Zeit warten:

Index Checker Wartebildschirm

Bei großen Sitemaps kann dies nun einige Zeit dauern, funktioniert eventuell auch gar nicht, weil Google die IP wegen zu vieler Anfragen sperrt. Schon seit etlicher Zeit plane ich dagegen den Gang über Proxy Server, fand aber bis jetzt leider noch nicht die Zeit, dies zu realisieren.

Nun wird auch schon das Ergebnis angezeigt. Hier im Beispiel meine eigene Webseite, von der 4 von 26 Seiten nicht im Index von Google sind.

Index Checker Ergebnisbildschirm

Zugegeben derzeit noch nicht schön anzusehen, aber so lange die Funktionalität stimmt ist es doch erträglich.

Direkter Download

Geschrieben in Google | Tags: , , , , |

8 Kommentare

  1. DavidG Sagt:

    Schönes und vor Allem nützliches Tool. Ich sag mal danke ;-)

  2. Sabrina Sagt:

    Hallo Markus!

    Ein wirklich sehr gutes Tool, hab es mir direkt mal runtergeladen - danke!

  3. Josef Sagt:

    Hi Markus,

    vielen Dank für das Super-Tool. Echt nützlich.

  4. Steffen Sagt:

    Hallo,

    ich habe mir dein TOOL auch heruntergeladen, bekomme es allerdings nicht zum laufen :-(
    Ist der Index Checker nur für windows vista gedacht?

    Wenn ich die EXE aufrufen kommt “Die Anwendung konnte nicht richtig initalisiert werden”. Eine xml-Sitemap liegt im Ordern des IndexCheckers. Dieser befindet sich auf meinen Desktop. Nutze tue ich Windows XP Prof. SP3

    Hättest du einen Tipp für mich?

    MfG Steffen

  5. Steffen Sagt:

    Ah, bei mir hat das Microsoft Framework gefehlt! Jetzt klappt es bei mir auch auf dem Rechner!

    Gibt es eigentlich davon auch eine Online-Version? Ich meine dieses Tool online auf einer Webseite zu nutzen?

    Mfg Steffen

  6. Ronny Sagt:

    Sehr gutes Tool. Danke

  7. Gennaro Sagt:

    Ein sehr interessantes Tool. Problem ist allerdings die Abfrage von großen Sitemaps und da wird es für Webmaster ja eigentlich erst interessant. Ich bin nicht sicher, ob der Umweg über ProxyServer diesbezüglich tatsächlich was bringt. Nach der wievielten Abfrage wird eigentlich die IP gesperrt bzw. das nette Captcha angezeigt? Eine andere Möglichkeit wäre, die gesamte Seite (site:http://www.domainroot.tld) abzufragen und dann die einzelnen Ergebnisseiten zu parsen und mit der Sitemap zu vergleichen. Ist allerdings auch auf 10 Ergebnisseiten x 100 Ergebnisse je Seite = 1000 Seiten maximal beschränkt, sind aber auch nur 10 Abfragen nötig.

  8. Markus Kindler Sagt:

    @Gennaro: Also ich bin durchaus davon überzeugt, dass sich das Ganze mit anonymen Proxyservern realisieren lässt. Leider habe ich es bis heut nicht hinbekommen, dies zu realisieren, da komischerweise keins der Tutorials dafür bei mir klappen will.
    Der Weg über die site Abfrage der kompletten Domain ist sicher auch ganz nett, bringt aber auch “nur” 1000 Seiten als Ergebnis, aber beides könnte man ja kombinieren.

Einen Kommentar abgeben

Bitte beachte: Die Kommentare werden moderiert. Dies kann zu Verzögerungen bei Deinem Kommentar führen. Es besteht kein Grund den Kommentar erneut abzuschicken.