其实百度优化都是有公式的,不过一般人看不懂,那个都长的跟密码是的,北京百度优化如果让人人都能看懂的话就不叫百度优化了,不难发现,TF-IDF基于页面的重要性以及内容的广度相关性,所以说,我们一味的堆某个关键词密度这种黑帽做法已经不可取了,我们接下来网站的SEO要怎么做才好呢?做相关产品的长尾词! 如果说一个网站能出现排名是100%的话,TF-IDF占40%,用户体验占40%,外链和友链占20%合起来一共100%,那么TF-IDF则尤为重要。
TF-IDF被称为词频-逆向文件频率,它用于信息检索与文本挖掘的常用加权技术。用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降(类似我们经常说的密度)。
*TF:词频
关键词在文本中出现的频率。
*IDF:逆向文件频率
逆向文件频率 (IDF) :某一特定词语的IDF,可以由总文件数目除以包含该词语的文件的数目,再将得到的商取对数得到。如果包含词条t的文档越少, IDF越大,则说明词条具有很好的类别区分能力。