#!/usr/bin/python # -*- coding: UTF-8 # filename BF import time """ t="this is a big apple,this is a big apple,this is a big apple,this is a big apple." p="apple" """ t="为什么叫向量空间模型呢?其实我们可以把每个词给看成一个维度,而词的频率看成其值(有向),即向量,这样每篇文章的词及其频率就构成了一个i维空间图,两个文档的相似度就是两个空间图的接近度。假设文章只有两维的话,那么空间图就可以画在一个平面直角坐标系当中,读者可以假想两篇只有两个词的文章画图进行理解。" p="读者" i=0 count=0 start=time.time() while (i <=len(t)-len(p)): j=0 while (t[i]==p[j]): i=i+1 j=j+1 if j==len(p): break elif (j==len(p)-1): count=count+1 else: i=i+1 j=0 print count print time.time()-start