SEO Crawler und Meta Data Explorer 🔎

Artikel Tools Generatoren

21.10.2019

Wofür brauchst du den Meta Data Explorer?

Inhaltsverzeichnis

[[TABLE OF CONTENTS]]

Facebook
Twitter
Telegram
WhatsApp
Mail

Der Meta Data Explorer liefert dir eine Übersicht über die wichtigsten Infos zu deiner Domain. Damit kannst du zum Beispiel folgende Szenarien analysieren:

Hast du Links auf andere Seiten, die du vergessen hast oder nicht siehst? Der Metadaten-Scrapper schaut sich den Source Code der Seite an und findet alle Links. Er sortiert diese nach externen und internen Links. So kannst du die Links deiner Webseite ganz einfach lesen.

Mit dem Tool kannst du eine Seite anfragen und es wird dir der HTTP Status Code zurückgegeben. Bei Redirects wird die URL angefragt, auf die der Redirect gesetzt wurde. Eine Redirect ist die Weiterleitung auf eine andere Seite.

Das Canonical Tag wird ausgegeben. So kannst du schnell überprüfen, ob die angefragte Seite auch der kanonischen URL entspricht.

Hinweis

Anfrage Starten

Was ist eine Kanonische URL ?

Kanonische URLs sind dazu da, Duplicate Content korrekt auszuzeichnen. Gibt es einen Artikel zum Beispiel unter zwei Kategorien, würde Google eine Abstrafung vornehmen, da der Inhalt doppelt vorhanden ist. Durch eine kanonische URL kann man Google nun sagen, welcher Artikel das Original ist. Google berücksichtigt diese; hier zum Beispiel die Ausgabe des Canonicals in der Search Console von Google.

Die Kanonische URL kannst du ganz einfach definieren:

<link rel="canonical" href="https://hellocoding.de/">

Durch das rel Attribute wird definiert, dass die URL eine kanonische URL ist. Der href gibt die URL an. Dieses Link Tag muss im <head> der HTML Seite stehen.

Was ist ein HTTP Status Code?

Der HTTP Status Code wird bei Anfragen an einen Server immer an den Client als Antwort zurückgegeben, um einen Erfolg der Anfrage zu identifizieren oder eben bei einem Nicht-Erfolg genauer eingrenzen zu können, warum das Dokument nicht zurückgegeben werden konnte.

Eine kleine Aufführung der häufigsten Status Codes:

200 - OK

Der 200 Status Code sagt aus, dass die Anfrage vom Server verarbeitet werden konnte. Daraufhin wird die Antwort zurückgegeben.

307 - Temporary Redirect

Der 307 Status Code besagt das eine Weiterleitung nur temporärer Natur ist und nach einiger Zeit sich wieder zurückändern könnte.

308 - Permanent Redirect

Der 308 Status Code besagt, dass eine Weiterleitung für immer gesetzt ist und nicht mehr ändern wird.

Die ursprüngliche Request Methode wird bei der Weiterleitung mit 307 und 308 beachtet

403 - Forbidden

Der Status Code 403 gibt meistens eine weiße Seite mit den Worten “Forbidden 403” zurück. Das heißt, der Client hat nicht die nötigen Berechtigungen um die Seite vom Server abzurufen.

404 - Not Found

Der Status Code 404 ist wohl gleich der bekannteste, da dieser erscheint, wenn eine Ressource auf dem Server nicht gefunden wurde.

418 - I’m a teapot

Mit dieser Teekanne kannst du leider keinen Kaffee im Coffee Pot Control Protocol kochen; es wurde aus Versehen eine Teekanne anstatt einer Kaffeekanne verwendet. Dieser Status Code ist eine Aprilscherz aus dem Jahr 1998.

Die Browserunterstützung ist von allen Browsern gegeben. https://developer.mozilla.org/de/docs/Web/HTTP/Status/418

500 - Internal Server Error

Der 500 Fehler ist ein server-interner Fehler, heißt: Wenn du in deiner Backend Sprache (zum Beispiel PHP) einen Fehler machst, kann es sein, dass, wenn der Server dafür entsprechend konfiguriert ist, nicht die Fehlermeldung von PHP ausgegeben, sondern ein 500 Status Code zurückgegeben wird.

Backend Sprache bezeichnet die Sprache, die auf dem Server läuft, und ist im Hintergrund für den Nutzer der Webseite nicht ersichtlich.

Vorsicht vor Status Code 301 & 302

Diese sind ebenfalls für das Weiterleiten zuständig; allerdings kann es bei diesen Methoden oft vorkommen, dass ein POST Request in eine GET Request umgewandelt wird.

Primär sind vor allem URL-Hijackings der Grund dafür, dass diese Request Methoden grundsätzlich zu vermeiden sind und besser auf einen 307 oder 308 Status Code zurückgegriffen werden sollte. Diesen ist es nicht erlaubt die Request Methode zu ändern.

Was sind Metadaten?

Metadaten sind zusätzliche Informationen im <head> einer Webseite, diese helfen, die Informationen der Seite zu verstehen. Dort könnten zum Beispiel folgende Metainformationen hinterlegt sein:

Open Graph Protocol Daten (https://ogp.me/)
Favicon
Charset
Twitter Daten
Facebook Daten
Title und Description

Die Informationen helfen verschiedenen Tools den Inhalt deiner Webseite besser analysieren zu können.

Womit Arbeitet dieses Tool?

Express

(https://expressjs.com/de/)

Express ist ein Webserver und Framework für NodeJS, das es dir ermöglicht, Routen anzulegen, Controller einzurichten und mit Template Engines zu arbeiten.

Dafür eignet sich der Express Generator. Diese CLI bietet dir die Möglichkeit, schnell Und einfach ein kleines Template für deine Applikation zu erstellen.

Mehr Informationen zu Express Generator findest du hier: https://expressjs.com/de/starter/generator.html

Request

(https://www.npmjs.com/package/request)

Request macht - wie der Name schon sagt - einen Request an den Server und holt sich dadurch die angefragte Seite.

Cheerio

(https://github.com/cheeriojs/cheerio)

Das JQuery für Node JS ist Cheerio. Nativ hat NodeJS kein Dom oder die Möglichkeit, diesen zu interpretieren, weshalb man einen Dom-Interpreter benötigt. Für diesen Zweck habe ich Cheerio verwendet.

URL - Node JS integriertes Module

Mit dem Befehl new URL() kannst du dir sowohl eine Übersicht der Parameter einer URL generieren als auch eine Relative URL in eine Absolute URL umwandeln.

Weitere Infos zu dem URL Module findest du hier: https://nodejs.org/docs/latest/api/url.html

Changelog

03.11.2019

Interne und Externe Links werden nun bei Unterseiten Gezählt.
Bei Überschriften wird nun die Hirachie angezeigt.
Meta Daten ohne ein Name oder Property Attribute werden nicht mehr ausgegben.

09.04.2022

Rich Results als zusätzlicher Check hinzugefügt.
Schema Markup Validator Tool Check entfernt.
PageSpeed Check ausgetauscht.
Großes Update am Design des Meta Data Explorers.

23.06.2024

Nach nun mehr als 5 Jahren wurde es Zeit, einmal den kompletten Quelltext des Meta Data Explorers zu aktualisieren. In diesem Zuge habe ich mich dafür entschieden, den ganzen Meta Data Explorer neu in Go zu schreiben. Damit einhergehend gab es noch mal einige Performance und Sicherheits-Optimierungen.

Hinterlasse mir gerne einen Kommentar zum Artikel und wie er dir weitergeholfen hat beziehungsweise, was dir helfen würde das Thema besser zu verstehen. Oder hast du einen Fehler entdeckt, den ich korrigieren sollte? Schreibe mir auch dazu gerne ein Feedback!

Facebook
Twitter
Telegram
WhatsApp
Mail

Artikel wurde Zuletzt aktualisiert am 23.06.2024.

Bildquelle - Vielen Dank an die Ersteller:innen für dieses Bild

https://unsplash.com/photos/-lp8sTmF9HA - Abgerufen am: 09.04.2022

Autor - Felix Schürmeyer

Felix Schürmeyer ist ein leidenschaftlicher Entwickler und der kreative Kopf hinter HelloCoding. Bereits seit seiner Kindheit programmiert er mit Begeisterung. Heute arbeitet Felix als Software Engineer und widmet sich in seiner Freizeit dem Schreiben fundierter Artikel für den HelloCoding Blog.

Autoren Seite

Der HelloCoding.de Podcast!

Falls du an Programmieren, Hardware und IT etwas Interesse hast ist dieser Podcast genau das Richtige für dich. Wir freuen uns auf dich!

HelloCoding, der Podcast. auf Spotify anhören

HelloCoding, der Podcast. mit deinem Podcast Player abspielen

Jetzt hören!

233 Nutzer sind Online!

Kommentare zum Artikel

Trecker schreibt ... Kommentar vom 26.11.2020

Cooles Programm hast du da geschrieben!

Moin, ich mach' mal den Anfang

den Metadata-Explorer finde ich toll! Habe ihn zwar noch nie verwendet geschweige denn gebraucht, aber ich kann mir vorstellen, dass dieses Tool für SEO Fanatiker nützlich ist. Ich hoffe mein kleiner Kommentar gefällt dir.

LG so'n Typ aus deinem Discord Forum

Antworten

Antwort von Felix Schürmeyer Kommentar vom 26.11.2020

Danke dir!

Hallo,

es freut mich das dir der Metadata-Explorer gefällt. Ja für SEO's ist es manchmal ganz nützlich Redirects sofort zu erkennen, oder auch 404 Links auf einer Seite.

Mit Freundlichen Grüßen,
Felix Schürmeyer

Comichaot schreibt ... Kommentar vom 30.07.2022

Cool

Tolles Tool, danke schön. Gerne mehr SEO-Tools.

Antworten

Antwort von Felix Schürmeyer Kommentar vom 30.07.2022

Re: Cool

Danke für dein Feedback, das freute mich! Weitere Tools findest du in der Kategorie Generatoren, wobei diese hier definitiv das Ausführlichste zurzeit ist. Ich hab definitiv noch Ideen für weitere klein Helferlein. :)

Kommentar schreiben

Soll falls vorhanden von Gravatar dein Profilbild Geladen werden? Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden, dass die mit diesem Formular übermittelten Daten zur Kommunikation zwischen HelloCoding und mir verwendet werden.

Vom Autor Empfohlen

Wie du mit SEO anfängst, wenn du Programmierer*in bist

Artikel SEO

11.03.2021

Wie du mit SEO anfängst, wenn du Programmierer*in bist

In diesem Guide will ich dir einen Einstieg in das Thema Suchmaschinenoptimierung geben, ich habe mich dabei an Programmierer gerichtet.

Artikel Tools Generatoren

26.04.2021

HTTP-Header Auslesen von Webseiten

Mit diesem Tool kannst du den HTTP-Header jeder Beliebigen Webseite auslesen und kannst einen User Agent wählen, so kannst du zum Beispiel Prüfen, ob eine Webseite einen bestimmten User Agent sperrt.

Python Browser Automatisierung mit Selenium

Artikel Coding Python

26.12.2020

Python Browser Automatisierung mit Selenium

In diesem Artikel erkläre ich dir, wie du mit Python und Selenium einen Browser automatisieren kannst.