首页 → 经典 → 心灵鸡汤
搜索引擎是什么意思通俗易懂(搜索引擎是什么)
日期:2023-02-13 18:01:15    编辑:网络投稿    来源:互联网
您好,今天飛哥來為大家解答以上的問題。搜索引擎是什么意思通俗易懂,搜索引擎是什么相信很多小伙伴還不知道,現在讓我們一起來看看吧!1、搜索引擎(英語:search engine)是一種信息
为你推荐:
  • 經典點贊過萬的語錄
  • 您好,今天飛哥來為大家解答以上的問題。搜索引擎是什么意思通俗易懂,搜索引擎是什么相信很多小伙伴還不知道,現在讓我們一起來看看吧!

    1、搜索引擎(英語:search engine)是一種信息檢索系統,旨在協助搜索存儲在計算機系統中的信息。

    2、搜索結果一般被稱為“hits”,通常會以表單的形式列出。

    3、網絡搜索引擎是最常見、公開的一種搜索引擎,其功能為搜索萬維網上儲存的信息。

    4、搜索引擎為一組項目提供了一個接口,使用戶能夠指定關于感興趣的項目的標準,并讓引擎找到匹配的項目,這些標準稱為搜索查詢。

    5、在文本搜索引擎的情況下,搜索查詢通常表示為識別一個或多個文檔可能包含的期望概念的一組單詞。

    6、有多種樣式的搜索查詢語法在嚴格性上有差異。

    7、它也可以在以前的站點中搜索搜索引擎中的名稱。

    8、而一些文本搜索引擎要求用戶輸入由白色空格分隔的兩個或三個字,其他搜索引擎可以使用戶能夠指定整個文檔,圖片,聲音和各種形式的自然語言。

    9、一些搜索引擎對搜索查詢進行改進,以增加通過稱為查詢擴展的過程提供質量集合的可能性。

    10、查詢理解方法可用于標準化查詢語言。

    11、擴展資料:一個完整的搜索引擎需要有網頁爬取和收錄,建立索引,查詢詞分析,搜索排序,推薦系統五個部分組成。

    12、網頁爬取和收錄。

    13、網絡爬蟲技術是網頁爬取的核心技術,可以通過編寫一定的程序或者腳本來對互聯網的信息進行抓取。

    14、在網頁抓取之后,要構建相應的數據庫來存儲我們爬取的網頁信息。

    15、但是互聯網的信息具有冗余性,主要原因是各大網站也都會在后臺進行爬蟲爬取,他們也會通過爬蟲來檢測一些熱點的內容或者文章,然后爬取其信息并對格式進行重新的組織,但其實網頁的內容幾乎都是一致的。

    16、所以在收錄爬蟲爬取的網頁信息之前,我們還要加入一個關鍵的環節——網頁去重,來確保我們數據庫中網頁的唯一性。

    17、2、建立索引在抓取了網頁的信息之后,需要對網頁的信息進行解析,抽取到網頁的主題內容和類別信息。

    18、其主要涉及的技術為文本識別和文本分類技術。

    19、網頁解析后的輸出往往是一些結構化的信息(每個網頁的信息完整度是不同的,需要統一對數據進行結構化操作),一般的結構化信息包括網頁的URL、網頁編碼、網頁標題、作者、生成時間、類別信息、摘要等等。

    20、在獲取了網頁結構化信息后,就要構建相應的索引了。

    21、為了加快響應用戶査詢的速度,網頁內容通過"倒排索引"這種高效查詢數據結構來保存,而網頁之間的鏈接關系也會予以保存。

    22、之所以要保存鏈接關系,是因為這種關系 在網F相關性排序階段是可利用的,通過"鏈接分析"可以判斷頁面的相對重要性,對于為用 戶提供準確的搜索結果幫助很大。

    23、由于互聯網的網頁信息是海量的,所以搜索引擎的構建離不開大數據處理平臺和云計算技術,目前較為常用的大數據處理平臺為Hadoop生態架構。

    24、3、查詢詞分析。

    25、查詢詞分析就是query分析或者query聚類。

    26、當搜索引擎接收到用戶的査詢詞后,首先需要對查詢詞進行分析,希望能夠結合查詢詞和用戶信息來正確推導用戶的真正搜索意圖。

    27、比如,一個用戶輸入的查詢詞為“養水仙花”,那么除了基本的內容匹配外,搜索引擎需要讀懂用戶,其實用戶的查詢詞還可以這樣被理解“水仙花的養法”,“水仙花好養不” 等等近意的查詢詞。

    28、在此之后,首先在緩存中査找,搜索引擎的緩存系統存儲了不同的查詢意圖對應的搜索結果,如果能夠在緩存系統找到滿足用戶需求的信息,則可以直接將搜索結果返回給用戶,這樣既省掉了重復計算對資源的消耗,又加快了響應速度。

    29、4、搜索排序搜索引擎在分析了用戶的查詢詞以后,如果緩存的信息無法滿足用戶的查詢需求,搜索引擎要根據索引來查詢數據庫的網頁內容,并根據網頁內容與用戶需求來進行網頁排序。

    30、網頁排序需要眾多的因素,其中最為主要的因素為網頁內容與用戶查詢內容的相似度(匹配度),這個不難理解,搜索引擎的基本功能就是查詢。

    31、如果一個搜索引擎無法為用戶提供用戶需要查詢的內容,那其也就不能稱為是一個搜索引擎,所以網頁內容與用戶查詢內容的相似度是網頁排序的一個首要依據;另外網頁的重要程度也是以關鍵元素,一個網頁的重要程度關乎了網頁內容的質量,在滿足用戶需求的基礎之上,用戶更加希望獲得高質量的內容,這是無可厚非的。

    32、根據上述因素,搜索引擎對查詢到的結果進行排序,然后展示給用戶。

    33、5、推薦系統其實從不嚴格的角度來說,整個網頁排序的過程就屬于一種推薦策略。

    34、從嚴格意義上來說,推薦系統并不屬于一個搜索引擎架構的必要環節,而且推薦系統在上述示意圖中并沒有顯示。

    35、但是一個優秀的搜索引擎不止要能分析出用戶查詢的基本需求,進一步來講,要能了解到或者猜測用戶的可能的下一步需求。

    36、目前隨著大數據的熱潮,各大互聯網公司和眾多專家認為推薦系統是解決互聯網大數據的一種有效途徑。

    37、而且,最近越來越多個性化推薦知識受到了熱捧。

    38、其實推薦系統在搜索引擎中往往是以中間頁的形式展示的,它的主要作用就是為推薦系統進行導流。

    39、參考資料來源:百度百科——搜索引擎。

    本文就為大家分享到這里,希望小伙伴們會喜歡。

    这里有更多你想看的
  • 符號網名大全花樣符
    • 本类最新
    • 精品图文
    • 时尚
    • 新闻
    • 生活
    • 视觉
    • 微爱
      栏目ID=88的表不存在(操作类型=0)

    头条推荐

    热门推荐

    特别推荐

    返回顶部