什么是深度优先搜索
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束.
事实上,深度优先搜索属于图算法的一种,英文缩写为DFS即Depth First Search.其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次.
在我们遇到的一些问题当中,有些问题我们不能够确切的找出数学模型,即找不出一种直接求解的方法,解决这一类问题,我们一般采用搜索的方法解决。搜索就是用问题的所有可能去试探,按照一定的顺序、规则,不断去试探,直到找到问题的解,试完了也没有找到解,那就是无解,试探时一定要试探完所有的情况(实际上就是穷举);对于问题的第一个状态,叫初始状态,要求的状态叫目标状态。搜索就是把规则应用于实始状态,在其产生的状态中,直到得到一个目标状态为止。产生新的状态的过程叫扩展(由一个状态,应用规则,产生新状态的过程)搜索的要点:(1)初始状态;(2)重复产生新状态;(3)检查新状态是否为目标,是结束,否转(2);如果搜索是以接近起始状态的程序依次扩展状态的,叫宽度优先搜索。如果扩展是首先扩展新产生的状态,则叫深度优先搜索。深度优先搜索深度优先搜索用一个数组存放产生的所有状态。(1)把初始状态放入数组中,设为当前状态;(2)扩展当前的状态,产生一个新的状态放入数组中,同时把新产生的状态设为当前状态;(3)判断当前状态是否和前面的重复,如果重复则回到上一个状态,产生它的另一状态;(4)判断当前状态是否为目标状态,如果是目标,则找到一个解答,结束算法。(5)如果数组为空,说明无解。对于pascal语言来讲,它支持递归,在递归时可以自动实现回溯(利用局部变量)所以使用递归编写深度优先搜索程序相对简单,当然也有非递归实现的算法。搜索是人工智能中的一种基本方法,是一项非常普遍使用的算法策略,能够解决许许多多的常见问题,在某些情况下我们很难想到高效的解法时,搜索往往是可选的唯一选择。按照标准的话来讲:搜索算法是利用计算机的高性能来有目的的穷举一个问题的部分或所有的可能情况,从而求出问题的解的一种方法。搜索虽然简单易学易于理解,但要掌握好并写出速度快效率高优化好的程序却又相当困难,总而言之,搜索算法灵活多变,一般的框架很容易写出,但合适的优化却要根据实际情况来确定。在搜索算法中,深度优先搜索(也可以称为回溯法)是搜索算法里最简单也最常见的,今天我们就从这里讲起,下面的内容假设读者已经知道最基本的程序设计和简单的递归算法。
这是我找的资料,希望能帮到你~~
怎样在百度深度搜索
搜索技巧,最基本同时也是最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循:
表述准确百度会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。
一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。
例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。
另一类典型的表述不准确,是查询词中包含错别字。
例如,要查找林心如的写真图片,用“林心如写真”,当然是没什么问题;但如果写错了字,变成“林心茹写真”,搜索结果质量就差得远了。
不过好在,百度对于用户常见的错别字输入,有纠错提示。您若输入“林心茹写真”,在搜索结果上方,会提示“您要找的是不是:林心如写真”。
查询词的主题关联与简练目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。
还是用实际例子说明。某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。
这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。
绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。
因此,最好的查询词,应该是“时间名言”。
试着找出下述查询词的问题,并想出更好的能满足搜索需求的查询词:
所得税会计处理问题探讨
周星驰个人档案和所拍的电影
根据网页特征选择查询词很多类型的网页都有某种相似的特征。例如,小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而页面上通常有“目录”两个字,点击页面上的链接,就进入具体的章节页,章节页的标题是小说章节名称;软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词。等等。
经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。
例如,找明星的个人资料页。一般来说,明星资料页的标题,通常是明星的名字,而在页面上,会有“姓名”、“身高”等词语出现。比如找林青霞的个人资料,就可以用“林青霞姓名身高”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名身高 intitle:林青霞”。Intitle,表示后接的词限制在网页标题范围内。
这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是,您必须了解这种共性(或者通过试验性搜索预先发现共性)。
更多的在
谁知道深度搜搜索的优势是什么
我来解答,看样子深度搜已经有很多人知道了。深度搜其实还是搜索引擎,只不过是专业领域的,比如
医学,人文,金融,论文,学术等内容,看字面意思就能明白个差不多,一般搜索引擎是搜网络的表面,干扰信
息很多,而深度搜就是搜表面以下的,可以屏蔽掉无关信息和垃圾站点,干扰少很多,减少你辨别的时间,而且更专业。它的好处就在于不但能搜索到大量精准的相关文献,还可以在中英文之间任意切换,而且任意输入一个关键词搜索,左边都会自动生成与关键词相关的联想分类。
文章到此结束,希望我们对于深度搜索和怎样在百度深度搜索的问题能够给您带来一些启发和解决方案。如果您需要更多信息或者有其他问题,请随时联系我们。