Web & DSLR-Fotografie

Als gelernter Medienoperator Non-Print, möchte ich mein Fachwissen rund um Webserver, die Programmierung mit PHP und technische Erfahrungen nicht vorenthalten.

Spezialisiert auf den Bereich TYPO3 CMS Entwicklung als TYPO3 CMS Certified Developer (TCCD), TYPO3 CMS Certified Editor (TCCE) und TYPO3 Core Contributor.

Auch die digitale Spiegelreflexfotografie wird thematisiert. Zahlreiche Fotogalerien aus Norddeutschland und von Veranstaltungen sind einsehbar.

März
17

TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen

Auf der Suche nach der Problemlösung von "canoncial urls" in Typo3 und Allgemein Webseiten-Projekten mit Extensions / Scripten bin ich auf den Internetauftritt der Marit AG gestoßen und konnte mir für Typo3 (TypoScript) einen sehr angenehmen und hilfreichen Codesnippet holen, um die Duplicate Content-Geschichten für Suchmaschinen zu umgehen.

Denn um die Duplicate Content Problematik zu lösen gibt es seit einigen Tagen den “Canonical Meta-Tag” den die größten Suchmaschinen im Internet, Google, Yahoo! und Microsoft unterstützen.

Im Head-Bereich der Internetseite wird nun unter den bekannten MetaTags wie "robots", "language", und weitere MetaTags auch der"rel=canoncial" Tag eingebunden.

Der Canonical MetaTag sieht wie folgt aus:

<link rel=”canonical” href=”http://www.domain.de/pagename.html” />

Im Framework TYPO3 hat man automatisch Duplicate Content, da eine Inhaltsseite zum Beispiel über "http://www.domain.de/index.php?id=1" oder über http://www.domain.de/?id=64 oder http://www.domain.de/pagename.html (via RealUrl umgeschrieben) erreichbar ist.

Da das Typo3-Framework bis Dato nicht wirklich auf die Suchmaschinenoptimierung ausgelegt ist und wenig HeaderData-Informationen mitbringt, werden wir aufgefordert die Canonical-Informationen eigenhändig in die Meta-Data zu schreiben.

Via TypoScript lässt sich dies, wie schon zu Beginn dieses Artikels erwähnt, wunderbar lösen.

Es gibt derzeit viele Lösungsansatz im Internet, jedoch sind diese meist statisch mit der sogenannten config.baseURL von Typo3 verknüpft und müssten bei einem Server oder Domainumzug zusätzlich angepasst werden.
Mit der TypoScript-Lösung von der MaritAG und meiner Erweiterung in dem TypoScriptcode lässt sich der schon vorhandene Typo3 config.baseURL-Pfad vererben und somit muss keine zusätzliche Anpassung mehr vorgenommen werden.

Direkt im Typo3 Backend würde der Code wie folgt aussehen:

### [Begin] Canonical Duplicate-Content Vermeidung ###
lib.canonical = COA
lib.canonical {
#Eckige Klammern mit spitzen Tag-Klammern ersetzten:
wrap = <link rel="canonical" href="|" />
1 = TEXT
1 {
value < config.baseURL
wrap = |

}
2 = TEXT
2.typolink {
parameter = {page:uid}
parameter.insertData = 1
useCacheHash = 1
# add all get parameters from the current URL
addQueryString = 0
addQueryString.method = GET
# remove the page id from the parameters so it is not inserted twice
addQueryString.exclude = id
returnLast = url
}
}
page.headerData.200 < lib.canonical
## [END] Canonical Duplicate-Content Vermeidung ###

In dem Code lassen sich div. Einstellungen vornehmen. Unter anderem lässt sich einstellen, ob die gesamten GET-Parameter in der URL übernommen werden sollen oder nicht. Wird der Wert von "addQueryString" auf "1" gesetzt, werden an die URLs, alle GET-Parameter übermittelt und wir haben somit auch wieder Duplicate Content ....
Aufgrund dessen ist dieser Wert bei mir auf "0" gesetzt. Wir wollen nur die Seite, ohne Zusatzparameter in der Suchmaschine haben.

Der "wrap" in dem ersten Element der "lib.canonical" bindet die config.baseURL ein und übermittelt diese an den Haupt-Wrapper der "lib.canonical". So haben wir eine relativ dynamische baseURL, sollte man die Domain mal wechseln.
Natürlich muss die config.baseURL im TypoScript definiert sein.

config.baseURL = http://www.domain.tld/

Das letzte Slash "/" darf bei der baseURL nicht vergessen werden, ansonsten werden alle Links falsch generiert und der Internetauftritt funktioniert nicht mehr.

Tags: baseUrl, canoical, canoncial, code, development, duplica content, metadata, metaheader, seo, suchmaschinen, tag, TS, typo3, typoscript

von Jörg am 17.03.2009, unter TYPO3 Webentwicklung & Programmierung
3 Kommentare

Peter Scheffler says:

4. März 2010 um 12:46 Uhr

Bei mir war zur korrekten Ausgabe neben der Angabe von config.baseURL = http://www.domain.tld/ außerdem noch die
config.absRefPrefix = http://www.domain.tld/. Ansonsten wurde nur der Pfad, nicht aber die komplette Domain ausgegeben.

Riesen Dan says:

12. Dezember 2011 um 12:20 Uhr

Hallo Jörg,
Danke für dein Tipp. Hatte damit aber Probleme mit der Startseite, da gab’s mir ein //. Musste dies nun mit einer Variablen lösen:

Constants
# url fuer canonical
# Default
meineVariable {
var99 = http://www.xxx.ch
}
# ALOCO
[globalVar = TSFE:id=1]
meineVariable {
var99 = http://www.xxx.ch/
}
[global]

Setup
lib.canonical = TEXT
lib.canonical {
typolink.parameter.data = TSFE:id
typolink.returnLast = url
wrap =
}
page.headerData.1000 < lib.canonical

Thomas says:

18. Januar 2012 um 10:14 Uhr

Warum einfach wenn’s auch kompliziert geht? Anstatt das TypoScript-Gewurstel ziehe ich so etwas vor.

Im TypoScript:
page2.headerData.300 = PHP_SCRIPT_EXT
page2.headerData.300.file = fileadmin/php/canonical_link.php

In der PHP-Datei:
$absRequestUri = ‚http://‘ . $_SERVER[‚HTTP_HOST‘] . $_SERVER[‚REQUEST_URI‘];
$absRequestUri = str_replace(‚type=1‘, “, $absRequestUri);
$absRequestUri = rtrim($absRequestUri, ‚?&‘);

$content = sprintf(“, $absRequestUri);

Web & DSLR-Fotografie

TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen

3 Antworten auf "TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen"

Hinterlasse eine Nachricht

Fotogalerien

Neueste Beiträge

Tags

Kategorien

Web

Infos

Archiv

Jörg Bösche – Developer & Fotografie

Web & DSLR-Fotografie

TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen

3 Antworten auf "TYPO3: Canonical-Tag gegen Duplicate Content in Suchmaschinen"

Hinterlasse eine Nachricht

Fotogalerien

Neueste Beiträge

Tags

Kategorien

Web

Infos

Archiv

Jörg Bösche – Developer & Fotografie

This website uses cookies