TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen

Auf der Suche nach der Problemlösung von "canoncial urls" in Typo3 und Allgemein Webseiten-Projekten mit Extensions / Scripten bin ich auf den Internetauftritt der Marit AG gestoßen und konnte mir für Typo3 (TypoScript) einen sehr angenehmen und hilfreichen Codesnippet holen, um die Duplicate Content-Geschichten für Suchmaschinen zu umgehen.

Denn um die Duplicate Content Problematik zu lösen gibt es seit einigen Tagen den “Canonical Meta-Tag” den die größten Suchmaschinen im Internet, Google, Yahoo! und Microsoft unterstützen.

Im Head-Bereich der Internetseite wird nun unter den bekannten MetaTags wie "robots", "language", und weitere MetaTags auch der"rel=canoncial" Tag eingebunden.

Der Canonical MetaTag sieht wie folgt aus:

<link  rel=”canonical” href=”http://www.domain.de/pagename.html” />

Im Framework TYPO3 hat man automatisch Duplicate Content, da eine Inhaltsseite  zum Beispiel über "http://www.domain.de/index.php?id=1" oder über http://www.domain.de/?id=64 oder http://www.domain.de/pagename.html (via RealUrl umgeschrieben) erreichbar ist.

Da das Typo3-Framework bis Dato nicht wirklich auf die Suchmaschinenoptimierung ausgelegt ist und wenig HeaderData-Informationen mitbringt, werden wir aufgefordert die Canonical-Informationen eigenhändig in die Meta-Data zu schreiben.

Via TypoScript lässt sich dies, wie schon zu Beginn dieses Artikels erwähnt, wunderbar lösen.

Es gibt derzeit viele Lösungsansatz im Internet, jedoch sind diese meist statisch mit der sogenannten config.baseURL von Typo3 verknüpft und müssten bei einem Server oder Domainumzug zusätzlich angepasst werden.
Mit der TypoScript-Lösung von der MaritAG und meiner Erweiterung in dem TypoScriptcode lässt sich der schon vorhandene Typo3 config.baseURL-Pfad vererben und somit muss keine zusätzliche Anpassung mehr vorgenommen werden.

Direkt im Typo3 Backend würde der Code wie folgt aussehen:

Typo3: Canonical MetaTag für Suchmaschinen

### [Begin] Canonical Duplicate-Content Vermeidung ###
lib.canonical = COA
lib.canonical {
#Eckige Klammern mit spitzen Tag-Klammern ersetzten:
wrap = <link rel="canonical" href="|" />
1 = TEXT
1 {
value < config.baseURL
wrap = |

}
2 = TEXT
2.typolink {
parameter = {page:uid}
parameter.insertData = 1
useCacheHash = 1
# add all get parameters from the current URL
addQueryString = 0
addQueryString.method = GET
# remove the page id from the parameters so it is not inserted twice
addQueryString.exclude = id
returnLast = url
}
}
page.headerData.200 < lib.canonical
## [END] Canonical Duplicate-Content Vermeidung ###

In dem Code lassen sich div. Einstellungen vornehmen. Unter anderem lässt sich einstellen, ob die gesamten GET-Parameter in der URL übernommen werden sollen oder nicht. Wird der Wert von "addQueryString" auf "1" gesetzt, werden an die URLs, alle GET-Parameter übermittelt und wir haben somit auch wieder Duplicate Content ....
Aufgrund dessen ist dieser Wert bei mir auf "0" gesetzt. Wir wollen nur die Seite, ohne Zusatzparameter in der Suchmaschine haben.

Der "wrap" in dem ersten Element der "lib.canonical" bindet die config.baseURL ein und übermittelt diese an den Haupt-Wrapper der "lib.canonical". So haben wir eine relativ dynamische baseURL, sollte man die Domain mal wechseln.
Natürlich muss die config.baseURL im TypoScript definiert sein.

config.baseURL = http://www.domain.tld/

Das letzte Slash "/" darf bei der baseURL nicht vergessen werden, ansonsten werden alle Links falsch generiert und der Internetauftritt funktioniert nicht mehr.

Tags: , , , , , , , , , , , , ,

3 Antworten auf "TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen"

  • Riesen Dan says:
  • Thomas says:
Hinterlasse eine Nachricht