推荐先读读google从入门到精通等文章.
我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。
关键的分析必须保证两点:
一是专业性,即这个词是很精的,可能简化你的搜索结果,因而词甚至可以怪一点,尽量避免大众化的词,如net,site等。即使需要大众化词,如password,username,但若加入一两个特征词,则结果将大大简化。
二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。
如何达到上述两个要求?我们必须分析网页中字词出现的特点,以及本学科专业词汇特征。
大家看看yahoo,google等medicine和science--biology条目下的分类,发现许多相关的词均在内,如




