IDF
Aus Seobility Wiki
Version vom 9. Mai 2019, 15:22 Uhr von Techteam (Diskussion | Beiträge)
Die inverse Dokumenthäufigkeit (Englisch: Inverse Document Frequency; kurz: IDF) dient u.a. in der Informationswissenschaft der Ermittlung von Worthäufigkeiten in Dokumenten. Dabei wird beispielsweise einem Wort, das nur in wenigen Dokumenten enthalten ist, eine höhere Relevanz beigemessen als einem Wort, das in nahezu jedem Dokument vorkommt. IDF und WDF werden gemeinsam zur Gewichtung von Worten in Dokumenten bei der Indexierung herangezogen.
Die Formel zur Berechnung der IDF lautet:
ND = Anzahl aller betrachteten Dokumente
fi = Anzahl der Dokumente, die Term i beinhalten