IDF: Unterschied zwischen den Versionen
Aus Seobility Wiki
(4 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
− | Die inverse Dokumenthäufigkeit (Englisch: Inverse Document Frequency; kurz: IDF) dient u.a. in der Informationswissenschaft der Ermittlung von Worthäufigkeiten in Dokumenten. Dabei wird beispielsweise einem Wort, das nur in wenigen Dokumenten enthalten ist, eine höhere Relevanz beigemessen als einem Wort, das in nahezu jedem Dokument vorkommt. IDF und [[WDF]] werden gemeinsam zur Gewichtung von Worten in Dokumenten bei der Indexierung herangezogen. | + | <seo title="Was ist IDF? Definition und Formel" metadescription="Die inverse Dokumenthäufigkeit dient u.a. in der Informationswissenschaft der Ermittlung von Worthäufigkeiten in Dokumenten. Jetzt weiterlesen ..." /> |
+ | |||
+ | Die [[Inverse Dokumenthäufigkeit|inverse Dokumenthäufigkeit]] (Englisch: Inverse Document Frequency; kurz: IDF) dient u.a. in der Informationswissenschaft der Ermittlung von Worthäufigkeiten in Dokumenten. Dabei wird beispielsweise einem Wort, das nur in wenigen Dokumenten enthalten ist, eine höhere Relevanz beigemessen als einem Wort, das in nahezu jedem Dokument vorkommt. IDF und [[WDF]] werden gemeinsam zur Gewichtung von Worten in Dokumenten bei der [[Indexierung]] herangezogen. | ||
Die Formel zur Berechnung der IDF lautet: | Die Formel zur Berechnung der IDF lautet: | ||
Zeile 8: | Zeile 10: | ||
f<sub>i</sub> = Anzahl der Dokumente, die Term i beinhalten | f<sub>i</sub> = Anzahl der Dokumente, die Term i beinhalten | ||
+ | |||
+ | == Ähnliche Artikel == | ||
+ | |||
+ | * [[WDF*IDF]] | ||
+ | * [[Content is King]] | ||
[[Kategorie:Suchmaschinenoptimierung]] | [[Kategorie:Suchmaschinenoptimierung]] |
Aktuelle Version vom 25. Februar 2021, 15:42 Uhr
Die inverse Dokumenthäufigkeit (Englisch: Inverse Document Frequency; kurz: IDF) dient u.a. in der Informationswissenschaft der Ermittlung von Worthäufigkeiten in Dokumenten. Dabei wird beispielsweise einem Wort, das nur in wenigen Dokumenten enthalten ist, eine höhere Relevanz beigemessen als einem Wort, das in nahezu jedem Dokument vorkommt. IDF und WDF werden gemeinsam zur Gewichtung von Worten in Dokumenten bei der Indexierung herangezogen.
Die Formel zur Berechnung der IDF lautet:
ND = Anzahl aller betrachteten Dokumente
fi = Anzahl der Dokumente, die Term i beinhalten