WDF*IDF: Unterschied zwischen den Versionen

Aus Seobility Wiki
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „== Definition == WDF*IDF ist eine Formel zur Berechnung der Gewichtung bestimmter Wörter in einem Dokument im Verhältnis zu der Gesamtheit an Dokumenten, di…“)
 
(Ähnliche Artikel)
 
(20 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
 +
<seo title="WDF*IDF" metadescription="Definition, Berechnung und Bedeutung für die Suchmaschinenoptimierung verständlich erklärt im Seobility Wiki." />
 +
 
== Definition ==
 
== Definition ==
 +
[[File:WDF-IDF.png|mini|450px|rechts|alt=WDF*IDF|'''Abbildung:''' WDF*IDF - Autor: Seobility - Lizenz: [[Creative Commons Lizenz BY-SA 4.0|CC BY-SA 4.0]]|link=https://www.seobility.net/de/wiki/images/c/c9/WDF-IDF.png]]
  
WDF*IDF ist eine Formel zur Berechnung der Gewichtung bestimmter Wörter in einem Dokument im Verhältnis zu der Gesamtheit an Dokumenten, die das gleiche Thema behandeln. Die Formel kann auch im Kontext von Webseiten angewandt werden und bezeichnet in dem Fall die Gewichtung bestimmter Wörter auf einer Seite im Verhältnis zu allen anderen Seiten, die zu dem betrachteten Suchbegriff ranken.
+
WDF*IDF ist eine Formel zur Berechnung der Gewichtung bestimmter Wörter in einem Dokument im Verhältnis zu der Gesamtheit an Dokumenten, die das gleiche Thema behandeln. Die Formel kann auch im Kontext von Webseiten angewandt werden und bezeichnet in dem Fall die Gewichtung bestimmter Wörter auf einer Seite im Verhältnis zu allen anderen Seiten, die zu dem betrachteten [[Suchbegriff]] ranken.
  
 
Mithilfe der WDF*IDF Formel können textliche Inhalte einer Website analysiert und mit anderen Seiten verglichen werden, um die Relevanz der eigenen Inhalte für einen bestimmten Suchbegriff zu erhöhen. Aus diesem Grund ist die Optimierung des eigenen [[Content is King|Contents]] nach WDF*IDF ein wichtiger Bestandteil der Suchmaschinenoptimierung (SEO) einer Website.
 
Mithilfe der WDF*IDF Formel können textliche Inhalte einer Website analysiert und mit anderen Seiten verglichen werden, um die Relevanz der eigenen Inhalte für einen bestimmten Suchbegriff zu erhöhen. Aus diesem Grund ist die Optimierung des eigenen [[Content is King|Contents]] nach WDF*IDF ein wichtiger Bestandteil der Suchmaschinenoptimierung (SEO) einer Website.
 +
 +
<html>
 +
<div class="checkform">
 +
<div class="hl">
 +
<h3>WDF*IDF Analyse</h3>
 +
<p>Prüfe die WDF*IDF Optimierung Deiner Seite für ein bestimmtes Keyword</p>
 +
</div>
 +
<form action="https://www.seobility.net/de/wdf-idf-tool/" target="_blank" method="post">
 +
<input type="text" required="required" name="keyword" placeholder="Keyword" pattern=".{1,140}"><input type="text" name="url" placeholder="URL (Optional)"><input type="hidden" name="engine" value="1"><input type="submit" value="WDF*IDF prüfen">
 +
</form>
 +
</div>
 +
</html>
  
 
== Berechnung ==
 
== Berechnung ==
Zeile 14: Zeile 29:
  
  
[[Datei:Formel WDF.PNG|link=|300px]]
+
[[Datei:Formel WDF.PNG|link=|border|300px|alt=WDF*IDF|WDF Formel als Teil von WDF*IDF]]
  
Freq(i,j) = Häufigkeit von Term i in Dokument j (= Termfrequenz)
+
Freq(i,j) = Häufigkeit von Term i in Dokument j (= [[Termfrequenz]])
  
 
L<sub>j</sub> = Gesamtanzahl der Terme in Dokument j
 
L<sub>j</sub> = Gesamtanzahl der Terme in Dokument j
Zeile 25: Zeile 40:
 
=== IDF ===
 
=== IDF ===
  
IDF ist die Abkürzung für “Inverse Document Frequency”, also die inverse Dokumentenhäufigkeit. Der Wert steht für die Anzahl aller betrachteten Dokumente im Verhältnis zu der Anzahl der Dokumente, die den Term i beinhalten. Es handelt sich somit um die inverse Dokumenthäufigkeit des Terms in der Gesamtheit der betrachteten Dokumente. Die Formel zur Berechnung des IDF-Wertes sieht folgendermaßen aus:
+
IDF ist die Abkürzung für “Inverse Document Frequency”, also die [[Inverse Dokumenthäufigkeit|inverse Dokumentenhäufigkeit]]. Der Wert steht für die Anzahl aller betrachteten Dokumente im Verhältnis zu der Anzahl der Dokumente, die den Term i beinhalten. Es handelt sich somit um die inverse Dokumenthäufigkeit des Terms in der Gesamtheit der betrachteten Dokumente. Die Formel zur Berechnung des IDF-Wertes sieht folgendermaßen aus:
  
[[Datei:Formel IDF.PNG|link=|250px]]
+
[[Datei:Formel IDF.PNG|link=|border|250px|alt=TF*IDF|IDF Formel als Teil von WDF*IDF]]
  
 
N<sub>D</sub> = Anzahl aller betrachteten Dokumente
 
N<sub>D</sub> = Anzahl aller betrachteten Dokumente
Zeile 36: Zeile 51:
 
Je weniger Dokumente den Term i beinhalten, desto größer ist die IDF und desto wichtiger der Term. Dies lässt sich damit begründen, dass seltene Begriffe aufschlussreicher für die inhaltliche Einordnung eines Dokuments sind als Begriffe, die in nahezu allen Dokumenten vorhanden sind. Aufgrund der höheren Bedeutung von seltenen Begriffen (repräsentiert durch einen hohen IDF-Wert) ergibt sich durch die Multiplikation mit der WDF somit ein höherer Gesamtwert.
 
Je weniger Dokumente den Term i beinhalten, desto größer ist die IDF und desto wichtiger der Term. Dies lässt sich damit begründen, dass seltene Begriffe aufschlussreicher für die inhaltliche Einordnung eines Dokuments sind als Begriffe, die in nahezu allen Dokumenten vorhanden sind. Aufgrund der höheren Bedeutung von seltenen Begriffen (repräsentiert durch einen hohen IDF-Wert) ergibt sich durch die Multiplikation mit der WDF somit ein höherer Gesamtwert.
  
=== WDF*IDF ===
+
=== Multiplikation von WDF und IDF ===
  
 
Durch die Multiplikation beider Einzelformen erhält man die relative Termgewichtung eines Begriffes in einem Dokument im Verhältnis zur Gesamtheit der betrachteten Dokumente. Dieser Wert ist hoch, wenn ein Term in einem Dokument sehr häufig vorkommt, aber in der Gesamtheit aller Dokumente eher selten ist. Dies wäre beispielsweise für den Term “SEO” in einem Text über Suchmaschinenoptimierung der Fall.
 
Durch die Multiplikation beider Einzelformen erhält man die relative Termgewichtung eines Begriffes in einem Dokument im Verhältnis zur Gesamtheit der betrachteten Dokumente. Dieser Wert ist hoch, wenn ein Term in einem Dokument sehr häufig vorkommt, aber in der Gesamtheit aller Dokumente eher selten ist. Dies wäre beispielsweise für den Term “SEO” in einem Text über Suchmaschinenoptimierung der Fall.
Zeile 48: Zeile 63:
 
Weiterhin können WDF*IDF Tools als Ideengeber für die Recherche nach bestimmten Unterthemen dienen, die einem Text zu einem bestimmten Suchbegriff behandelt werden sollten.
 
Weiterhin können WDF*IDF Tools als Ideengeber für die Recherche nach bestimmten Unterthemen dienen, die einem Text zu einem bestimmten Suchbegriff behandelt werden sollten.
  
[[Datei:WDFIDF Screenshot seobiltiy.PNG|link=|800px]]
+
[[Datei:WDFIDF Screenshot seobiltiy.PNG|link=|border|800px|alt=WDF*IDF Tool von Seobility|Screenshot des WDF*IDF Tools von Seobility]]
  
 
Screenshot mit beispielhafter WDF*IDF-Analyse für den Suchbegriff “SEO” von [https://www.seobility.net/de/wdf-idf-tool/ seobility.net]
 
Screenshot mit beispielhafter WDF*IDF-Analyse für den Suchbegriff “SEO” von [https://www.seobility.net/de/wdf-idf-tool/ seobility.net]
  
Insgesamt betrachtet bietet WDF*IDF im Vergleich zur Keyworddichte eine bessere Möglichkeit zur Optimierung des eigenen Contents und hat diese inzwischen abgelöst. Es handelt sich somit um ein wichtiges Element der Onpage-Optimierung, das nachweislich zu besseren Rankings beitragen kann.
+
Insgesamt betrachtet bietet WDF*IDF im Vergleich zur Keyworddichte eine bessere Möglichkeit zur Optimierung des eigenen Contents und hat diese inzwischen abgelöst. Es handelt sich somit um ein wichtiges Element der [[OnPage Optimierung|Onpage-Optimierung]], das nachweislich zu besseren Rankings beitragen kann.
  
 
== Nachteile ==
 
== Nachteile ==
Zeile 58: Zeile 73:
 
Trotz der hohen Bedeutung von WDF*IDF für die Content Optimierung hat die Formel auch Nachteile.
 
Trotz der hohen Bedeutung von WDF*IDF für die Content Optimierung hat die Formel auch Nachteile.
  
So ist der WDF*IDF Vergleich beispielsweise eher für Texte geeignet, die bei der Suchintention “Information” von Google als Ergebnisse angezeigt werden. Für anderweitige Inhalte, wie z.B. Produktbeschreibungen in Online-Shops, macht eine Optimierung nach WDF*IDF hingegen wenig Sinn.
+
So ist der WDF*IDF Vergleich beispielsweise eher für Texte geeignet, die bei der [[Suchintention]] “Information” von Google als Ergebnisse angezeigt werden. Für anderweitige Inhalte, wie z.B. Produktbeschreibungen in Online-Shops, macht eine Optimierung nach WDF*IDF hingegen wenig Sinn.
  
 
Ein weiterer Nachteil besteht darin, dass WDF*IDF Tools die gesamte Anzahl aller Dokumente kennen oder abschätzen können müssen, um sinnvolle Ergebnisse liefern zu können.
 
Ein weiterer Nachteil besteht darin, dass WDF*IDF Tools die gesamte Anzahl aller Dokumente kennen oder abschätzen können müssen, um sinnvolle Ergebnisse liefern zu können.
Zeile 73: Zeile 88:
  
 
* https://karlkratz.de/onlinemarketing-blog/termgewichtung-wdf-idf/
 
* https://karlkratz.de/onlinemarketing-blog/termgewichtung-wdf-idf/
* https://www.seo-book.de/onpage/was-wdfpidf-bedeutet-und-warum-das-wichtig-ist
+
* https://www.contentman.de/redaktionelles-arbeiten/was-an-wdfidf-ein-segen-und-was-ein-missverstaendnis-ist/
* https://www.mso-digital.de/wdf-idf-analyse-textoptimierung-einfach-erklaert/  
+
* https://www.mso-digital.de/wdf-idf-analyse-textoptimierung-einfach-erklaert/
 +
 
 +
== Ähnliche Artikel ==
 +
 
 +
* [[Content is King]]
 +
* [[Content Marketing]]
  
 
[[Kategorie:Suchmaschinenoptimierung]]
 
[[Kategorie:Suchmaschinenoptimierung]]
 +
 +
<html><script type="application/ld+json">
 +
    {
 +
      "@context": "https://schema.org/",
 +
      "@type": "ImageObject",
 +
      "contentUrl": "https://www.seobility.net/de/wiki/images/c/c9/WDF-IDF.png",
 +
      "license": "https://creativecommons.org/licenses/by-sa/4.0/deed.de",
 +
      "acquireLicensePage": "https://www.seobility.net/de/wiki/Creative_Commons_Lizenz_BY-SA_4.0"
 +
    }
 +
    </script></html>
 +
 +
{| class="wikitable" style="text-align:left"
 +
|-
 +
|'''Über den Autor'''
 +
|-
 +
| [[File:Seobility S.jpg|link=|100px|left|alt=Seobility S]] Das Seobility Wiki Team besteht aus SEO-, Online-Marketing- und Web-Experten mit praktischer Erfahrung in den Bereichen Suchmaschinenoptimierung, Online-Marketing und Webentwicklung. Alle unsere Artikel durchlaufen einen mehrstufigen Redaktionsprozess, um Dir die bestmögliche Qualität und wirklich hilfreiche Informationen bieten zu können. <html><a href="https://www.seobility.net/de/wiki/Seobility_Wiki_Team" target="_blank">Mehr Informationen über das Seobility Wiki Team</a></html>.
 +
|}
 +
 +
<html><script type="application/ld+json">
 +
{
 +
  "@context": "https://schema.org",
 +
  "@type": "Article",
 +
  "author": {
 +
    "@type": "Organization",
 +
    "name": "Seobility",
 +
    "url": "https://www.seobility.net/"
 +
  }
 +
}
 +
</script></html>

Aktuelle Version vom 23. Januar 2024, 17:29 Uhr

Definition

WDF*IDF
Abbildung: WDF*IDF - Autor: Seobility - Lizenz: CC BY-SA 4.0

WDF*IDF ist eine Formel zur Berechnung der Gewichtung bestimmter Wörter in einem Dokument im Verhältnis zu der Gesamtheit an Dokumenten, die das gleiche Thema behandeln. Die Formel kann auch im Kontext von Webseiten angewandt werden und bezeichnet in dem Fall die Gewichtung bestimmter Wörter auf einer Seite im Verhältnis zu allen anderen Seiten, die zu dem betrachteten Suchbegriff ranken.

Mithilfe der WDF*IDF Formel können textliche Inhalte einer Website analysiert und mit anderen Seiten verglichen werden, um die Relevanz der eigenen Inhalte für einen bestimmten Suchbegriff zu erhöhen. Aus diesem Grund ist die Optimierung des eigenen Contents nach WDF*IDF ein wichtiger Bestandteil der Suchmaschinenoptimierung (SEO) einer Website.

WDF*IDF Analyse

Prüfe die WDF*IDF Optimierung Deiner Seite für ein bestimmtes Keyword

Berechnung

Zur Berechnung des WDF*IDF-Wertes werden zwei Formeln benötigt: WDF und IDF.

WDF

WDF steht für “Within Document Frequency” und dient der Berechnung der Häufigkeit eines Terms, also eines einzelnen Wortes oder einer bestimmten Wortkombination, in einem Dokument oder auf einer Seite im Verhältnis zu allen anderen Termen auf dieser Seite. Die Formel hierfür lautet:


WDF*IDF

Freq(i,j) = Häufigkeit von Term i in Dokument j (= Termfrequenz)

Lj = Gesamtanzahl der Terme in Dokument j


Im Grunde handelt es sich hierbei um die Keyword-Density, mit dem einzigen Unterschied, dass die Werte logarithmiert werden. Die Logarithmierung dient der “Stauchung” der Ergebnisse, d.h. sie verhindert, dass besonders hohe Termhäufigkeiten den Wert verzerren.

IDF

IDF ist die Abkürzung für “Inverse Document Frequency”, also die inverse Dokumentenhäufigkeit. Der Wert steht für die Anzahl aller betrachteten Dokumente im Verhältnis zu der Anzahl der Dokumente, die den Term i beinhalten. Es handelt sich somit um die inverse Dokumenthäufigkeit des Terms in der Gesamtheit der betrachteten Dokumente. Die Formel zur Berechnung des IDF-Wertes sieht folgendermaßen aus:

TF*IDF

ND = Anzahl aller betrachteten Dokumente

fi = Anzahl der Dokumente, die Term i beinhalten


Je weniger Dokumente den Term i beinhalten, desto größer ist die IDF und desto wichtiger der Term. Dies lässt sich damit begründen, dass seltene Begriffe aufschlussreicher für die inhaltliche Einordnung eines Dokuments sind als Begriffe, die in nahezu allen Dokumenten vorhanden sind. Aufgrund der höheren Bedeutung von seltenen Begriffen (repräsentiert durch einen hohen IDF-Wert) ergibt sich durch die Multiplikation mit der WDF somit ein höherer Gesamtwert.

Multiplikation von WDF und IDF

Durch die Multiplikation beider Einzelformen erhält man die relative Termgewichtung eines Begriffes in einem Dokument im Verhältnis zur Gesamtheit der betrachteten Dokumente. Dieser Wert ist hoch, wenn ein Term in einem Dokument sehr häufig vorkommt, aber in der Gesamtheit aller Dokumente eher selten ist. Dies wäre beispielsweise für den Term “SEO” in einem Text über Suchmaschinenoptimierung der Fall.

Der WDF*IDF Wert ist hingegen niedrig, wenn ein Term in einem Dokument zwar häufig vorkommt, aber auch in allen anderen Dokumenten sehr oft auftaucht. Dies ist bei Stoppwörtern wie “und”, “den”, “mit” etc. gegeben. Solche Begriffe tragen nur wenig zur inhaltlichen Einordnung eines Dokuments bei.

Bedeutung für SEO

Mithilfe der WDF*IDF Formel kann der Inhalt auf der eigenen Website mit den Inhalten der am besten rankenden Seiten zu einem Keyword verglichen werden. Ein solcher Vergleich kann wichtige Optimierungspotenziale für den eigenen Content aufzeigen und ist beispielsweise mit dem WDF*IDF Tool von seobility möglich. WDF*IDF Tools geben Hinweise darauf, welche Begriffe häufiger oder seltener in einem Text vorkommen sollten, um ein optimales Verhältnis zu erreichen. Zudem kann anhand sogenannter “Proof-Keywords” die Relevanz der eigenen Texte für einen bestimmten Suchbegriff verdeutlicht werden. Hierbei handelt es sich um Terme, die semantisch nah am betrachteten Suchbegriff gelegen sind und den Text eindeutig diesem Suchbegriff zuordnen. Durch die Reduktion von zu häufig vorkommenden Termen kann hingegen vermieden werden, dass die eigenen Texte als Spam eingestuft werden. Spam wären in diesem Fall Dokumente, die über der durchschnittlichen Termgewichtung liegen.

Weiterhin können WDF*IDF Tools als Ideengeber für die Recherche nach bestimmten Unterthemen dienen, die einem Text zu einem bestimmten Suchbegriff behandelt werden sollten.

WDF*IDF Tool von Seobility

Screenshot mit beispielhafter WDF*IDF-Analyse für den Suchbegriff “SEO” von seobility.net

Insgesamt betrachtet bietet WDF*IDF im Vergleich zur Keyworddichte eine bessere Möglichkeit zur Optimierung des eigenen Contents und hat diese inzwischen abgelöst. Es handelt sich somit um ein wichtiges Element der Onpage-Optimierung, das nachweislich zu besseren Rankings beitragen kann.

Nachteile

Trotz der hohen Bedeutung von WDF*IDF für die Content Optimierung hat die Formel auch Nachteile.

So ist der WDF*IDF Vergleich beispielsweise eher für Texte geeignet, die bei der Suchintention “Information” von Google als Ergebnisse angezeigt werden. Für anderweitige Inhalte, wie z.B. Produktbeschreibungen in Online-Shops, macht eine Optimierung nach WDF*IDF hingegen wenig Sinn.

Ein weiterer Nachteil besteht darin, dass WDF*IDF Tools die gesamte Anzahl aller Dokumente kennen oder abschätzen können müssen, um sinnvolle Ergebnisse liefern zu können.

Weiterhin werden Aspekte wie Synonyme oder die Verteilung der Terme in einem Text, welche ebenfalls für die semantische Einordnung von Dokumenten wichtig sind, in der WDF*IDF Formel nicht berücksichtigt.

Darüber hinaus sollten sich Webseitenbetreiber bei der Content Optimierung nicht zu sehr auf WDF*IDF fokussieren, denn ein guter Text zeichnet sich nicht nur durch die Gewichtung bestimmter Terme aus. Faktoren wie die sprachliche Qualität, Lesefluss oder Emotionalisierung sind hierfür ebenfalls von hoher Bedeutung. Die strenge Umsetzung von Termhäufigkeiten kann hingegen dazu führen, dass die Lesbarkeit und Textqualität leidet.

Nicht zu vernachlässigen ist auch die Tatsache, dass sich die SERPs häufig ändern und infolgedessen alle Texte bei einer Änderung wieder neu analysiert und angepasst werden müssten. Aus diesem Grund sollte bei der WDF*IDF Optimierung der Fokus auf die wichtigsten Begriffe gelegt werden, anstatt überoptimiert wirkende Texte zu schreiben, die regelmäßig aktualisiert werden müssen.

Trotz der vielen Vorteile von WDF*IDF sollte abschließend stets bedacht werden, dass es sich hierbei nur um eines von vielen Elementen der Onpage Optimierung handelt. Die Formel ist kein Allheilmittel für eine Website und kann eine schlechte Backlink-Struktur u.ä. nicht ausgleichen.

Weiterführende Links

Ähnliche Artikel

Über den Autor
Seobility S
Das Seobility Wiki Team besteht aus SEO-, Online-Marketing- und Web-Experten mit praktischer Erfahrung in den Bereichen Suchmaschinenoptimierung, Online-Marketing und Webentwicklung. Alle unsere Artikel durchlaufen einen mehrstufigen Redaktionsprozess, um Dir die bestmögliche Qualität und wirklich hilfreiche Informationen bieten zu können. Mehr Informationen über das Seobility Wiki Team.

Überprüfen Sie Ihre Webseite mit
dem SEO Check!