全文搜索引擎如何工作？

4个回答

匿名用户2024-01-26

似乎没有增加太多。
匿名用户2024-01-25

搜索引擎的基本工作原理包括以下三个过程：一是在互联网上发现和收集网页信息; 同时对信息进行提取和整理，建立索引数据库; 然后，根据用户输入的查询关键字，检索器快速检出索引数据库中的文档，评估文档与查询的相关性，对要输出的结果进行排序，并将查询结果返回给用户。

1.抓取网页。每个独立的搜索引擎都有自己的网络爬虫，蜘蛛。爬虫蜘蛛跟随网页中的超链接从一个页面爬到另一个页面，通过超链接分析通过持续访问抓取更多的网页。

爬网的网页称为 Web 快照。由于超链接在互联网上的广泛使用，从理论上讲，绝大多数网页都可以从一定范围的网页中收集。

2.处理网页。搜索引擎抓到网页后，要做大量的前处理工作，才能提供检索服务。其中，最重要的是提取关键词，建立索引数据库和索引。

其他包括删除重复的网页、分词（中文）、确定网页类型、分析超链接、计算网页的重要性丰富度等。

3.提供检索服务。用户输入要搜索的关键字，搜索引擎从索引数据库中找到与该关键字匹配的网页; 为了方便用户判断，除了页面的标题和URL外，还提供了页面的摘要和其他信息。
匿名用户2024-01-24

在搜索引擎分类部分，我们提到了全文搜索引擎从**中提取信息来构建网页数据库的概念。搜索引擎的自动信息收集功能有两种类型。一种是常规搜索，即每隔一段时间（例如，谷歌一般是28天），搜索引擎就会主动调度"蜘蛛"该程序在特定的 IP 地址范围内搜索 Internet，一旦找到新的 Internet，它就会自动提取信息并将其添加到自己的数据库中。

另一种是提交搜索，即七七号的船主主动提交搜索，陪伴帆清，在一定时间内（从2天到几个月不等）定向到您的。"蜘蛛"程序，扫描您的**并将相关信息存储在数据库中供用户查询。由于搜索引擎索引规则已经发生了很大变化，未经请求的提交并不能保证您的内容会进入搜索引擎数据库，因此目前最好的办法是获得更多的外部链接，让搜索引擎有更多机会找到您并自动包含您的。

当用户用关键词搜索信息时，搜索引擎会在数据库中搜索，如果找到符合用户要求的内容，就会使用特殊的算法——通常是根据网页中关键词的匹配程度、位置、频率、链接质量等——来计算每个网页的相关性和排名水平，然后根据相关程度将这些 Web 链接按顺序返回给用户。
匿名用户2024-01-23

互联网搜索引擎是一个复杂的软件系统，旨在搜索万维网上的大量数据。他们通过提供我们搜索的特定单词或短语的最相关列表来帮助我们（他们的用户）了解我们需要知道的内容。对于我们大多数人来说，搜索是一种基本的网络工具。

没有它们，我们将不得不记住我们想要访问的每个**或页面的确切URL。虽然这对大多数人来说似乎令人难以置信，但实际上曾经有一段时间互联网就是这样运作的。幸运的是，情况发生了变化。