語義網是指在網頁上做特殊標記,以便電腦盡可能地瞭解網頁的內容。 語義搜索是指允許搜尋引擎瞭解用戶搜索關鍵字的真正含義,並顯示符合使用者需求的資料。 這個可能還不太明白,我詳細說明一下。 首先,我們必須弄清楚語義是什麼?
例如,以下網頁的資料,使用者可以很好地瞭解到電影名字是頭像,導演是詹姆斯科曼的生日是1954年8月16日,電影類型是科幻片,是電影預告片的網站。
但是,上述網頁資料不能讓搜尋引擎知道這些資料記述了什麼樣的內容。 如上例所示,通過特殊的標籤,搜尋引擎可以清楚地知道所有的資訊。 當然這個例子只是解說用的,讓讀者容易理解,但實際上沒有這些標記。
這樣構成的網路與本來的HTML網頁相比,可以使搜尋引擎理解頁面的真正含義,將這樣的網路稱為語義網。
意思是研究符號的意義。 現在,有意義的符號指的是人類的語言。 這樣的符號也稱為語言語義學,有意義的符號是語法(Syntax )和語用。 也就是說,要知道人類使用的語言,就必須知道該語言的詞義、語法、語用。
語法最容易理解,就是研究語法,語法正確就行,無論意義如何。 例如,從“哥哥吃了牆”、“哥哥”為主辭、“吃”為動詞、“牆”為詞綴、“了”為動詞這一動作的記述來看,語法上完全沒有問題,但聽起來很奇怪。
詞義和語用意義相似。 研究詞義後語言所表示的意義,語用與語境有關。
所以語用學比語義學複雜,因為語境的不同有不同的含義。 另外,不同的說話音調可能有不同的含義。 所以語義只有知道其意義,知道語用在什麼情況下使用,才能知道其真正的意義。
以上可能還很難理解,我舉個例子說明他們的不同。
如果有人說“不理”,詞義就是“我不想無視你”。 “無視”的意思是“說話”“在意”“關心”等,也就是說我會切斷與你之間存在的“連接線”。 語義是純粹研究這個詞的意思。
但是,就語用而言,必須知道這句話的上下文和語氣。 這句話,如果男女朋友之間俏皮的笑是^“無視”的話,也許是撒嬌的意思。 不僅語境和語氣,整個環境還可能影響同一詞在詞上的意義。“我的肚子好像在響”的人不是說“肚子在響”,而是想去“吃飯”。 同樣有人說“好像很熱”,但不是教你“熱”,而是暗示著“開冷氣”。
因此,要真正瞭解一句話的真正含義,不僅要研究詞義,還必須研究語用,但對於頁面的內容,只要將詞義淬火就足夠了。
語義網是實現語義檢索的準備,語義網和語義檢索不是同一個意思。 僅靠語義網無法完成語義檢索的任務,語義檢索所需的技術還很多。
簡單地說,語義網與標籤有關,語義搜索需要瞭解使用者下一個關鍵字所指的真正含義,並從海量資料中抓住使用者想要的資料。 根據維琪百科的解釋,語義網通過將電腦可理解的語義添加到全球資訊網路(如HTML )上的文檔中,使整個互聯網成為通用的資訊交換介質。
如果能夠正確地將適當的中繼資料添加到文檔中,就可以將非結構化的文檔資料轉換為結構化關係的資料,電腦就可以適當地處理和檢索這些資料。
語義搜索是瞭解用戶想要什麼,並通過多種方式提高搜索的準確性。 當然,語義web只是達成語義搜索的方法之一。 不能將所有文檔添加到中繼資料中。 另外,因為很多資料沒有結構化,非常雜亂。 只是,構建語義網可能是達成語義檢索的省力方法。 另外,語義網的目的是讓電腦和人腦一樣瞭解資料,讓電腦能夠自動處理一些事情。
所以,企業網站要盡可能達到語義網的要求,搜尋引擎就可以方便語義檢索。 通過允許搜尋引擎進行語義搜索,企業網站可以獲得更好的自然搜索排名。
穀歌在今年2013年屆滿15周年之際,發佈了一個以語義檢索為導向的革命性搜尋引擎運算式Hummingbird (蜂鳥演算法),以應對更複雜的搜索問題。 如果想用這個蜂鳥演算法引領網站,網站就必須成為語義網的一環。
這幾年可以說是語義技術的整合年,搜尋引擎的大工廠收購了有名的語義搜索技術的公司。 這是希望大家能在鴨子中暗中加把勁,為搜索服務提供更準確的資訊。 微軟在2008年吃了Powerset,穀歌在2010年收購了元web,Powerset和元web是語義技術的公司。Powerset創立了用人類自然語言回答問題的第一個出發點。 這個出發點和Wolfram Alpha很相似。 Metaweb是成立Freebase的公司,這個Freebase是開放的知識結構,有系統的組織組織了龐大的詞彙,這個詞彙是Common tag的依據_。 Faviki、Zementa基於這些資料提供系統性的標籤服務,該公共標籤也是雅虎支援的結構。 所以穀歌買了meta網路。 除了維琪百科以外,
除了DBpedia等之外,穀歌也可以主導這個資料來源。 當然,根據這些模式的不同,穀歌在語義檢索上肯定會有些許不同。 現在,用魔獸世界、穀歌、Bing玩: “ Whois Obama? ”的結果。 Wolfram Alpha告訴Obama疋米采四十四屆總統,谷歌也不能在知識圖譜上介紹Obama的生平,但百度只出現一般的搜索。
我們用Wolfram Alpha、Google、Bing問“李安年齡”,得出了以下結果。 Wolfram Alpha不懂中文,我們查錯了意思,穀歌和百度會告訴你正確的答案。
請看上面的搜索示例。 雖然Wolfram Alpha不理解中文問題,但是百度不喜歡英語問題。 谷歌不是中文的問題。 因為他們的資料庫整理了不同語義網的資料。
這些搜尋引擎必須能夠回答問題並具備三種能力。 第一個是理解用戶提出的問題,第二個是獲取足夠的資料,第三個是分析捕獲的資料,提供語義檢索。 這三個條件是不可缺少的。 如果他不理解使用者的問題的話,再多一些資料也沒用。 光有大量的資料,不能給出答案,只是一般的查詢。 如果有解析資料的能力,但是不能抓住足夠的資料,巧婦難為無米之炊。
目前,搜尋引擎面臨的問題是缺乏第一個和第三個能力。 也就是說,雖然資料已經很多了,但搜尋引擎無法從用戶的關鍵字中完全理解問題。 此外,由於捕獲的資料非常混亂,只有部分資料可以支援搜索結果。另外,仔細看看上面的例子,搜尋引擎給我答案的時候,通常在答案之後,自然搜索排名第一的是維琪百科的網頁,為什麼呢? 搜尋引擎之所以能得到答案,是因為維琪百科的頁面內容做出了最大的貢獻。
所以,如果你的網站具有語義網的特性,可以提供搜尋引擎進行搜索的話,我認為搜尋引擎應該把這個網站放在最前面。 因此,穀歌的蜂鳥演算法告訴大家已經開始了網路和語義檢索。 將來,如果能擁有優秀的自然搜索排行榜,就必須儘快加入語義網的行列。
語義因素對搜索排名有什麼影響?
語義是一個長期以來爭論的議題,目前的搜尋引擎大多只能提供參考資料,但大多數問題都無法準確回答。 但是,這個問題從2007年至今,所有技術和外部環境的發展,都足以使語義成為下一個SEO的重要因素。 如前一章所述,企業網站必須儘量達到語義網的要求,以使搜尋引擎能夠方便語義檢索,使網站不敗。 2011年,各大搜尋引擎宣佈接受Microdata的語義來表示網路內容。 另外,各搜尋引擎也支援並購和整合相關技術,對穀歌來說,1除了支援微軟資料外,還支援微軟和RDFa,隨著WTMLs的推廣,許多企業的網站都使用相關的標記, 很多網站不知道如何使用microformats和RDFa,與比較無關,但必須瞭解Microdata和HTMLs。 在社交網路中加入語義可能會使搜尋引擎變得更強大,社交網路上的權威人士共用、評估或1個網頁可能會影響網頁的SEO表現。 通過語義技術,可以瞭解這些權威人士的領域,通過社交網路的社交圈,搜尋引擎可以更好地瞭解所有人的搜索目的。 因此,你網站的內容能否正確地將索引分類到搜尋引擎中是非常重要的。 搜尋引擎處理了10個網站,其中8個網站正確使用了語義標記,其他兩個網站沒有使用語義標記,所以搜尋引擎可以很好地理解這8個網站。 對於兩個不使用語義標記的網站,只需推測其內容,你認為哪個可以優先選擇搜索結果頁面? 答案應該很清楚。 我說語義戰略越來越重要。 這個語義戰略是穀歌知識圖譜的基礎。 許多讀者需要的是答案不是海量的資料清單,知識圖譜就是滿足這個需求。 穀歌在繼續各種實驗之後,應該能夠接近搜索者想要的結果。 而且,如果你的內容能加入這個知識圖譜,你的網站當然能增加曝光。 現在,知識地圖是知識內容,但之後逐漸擴展到商業消息上,你的網站必須開始規劃語義戰略以適應這一發展。 谷歌蜂鳥演算法是谷歌新思維的演算法,被命名為蜂鳥是precise and fast (準確、快速)的意思。 也就是說,蜂鳥演算法可以理解使用者真正需要的資料,並迅速給出搜索結果。 當然,現在使用中文不能完全滿足準確迅速的要求,但應該會逐漸感受到語義檢索的不同。
例如,讓我們看看穀歌的知識地圖和臉書的公司爸爸地圖。 一個是試圖從網上上海量的事實中整理人類知識,另一個是從人類互聯網的相互作用中找到資訊傳播的途徑。
雖然知識圖譜與社交圖譜的著眼點是相同的資訊,但從不同的角度來看,穀歌發展之初互聯網才剛剛興起,當時使用者很少,只有部分網站管理員進行了內容的製作,所以網站管理員創建的頁面之間Facebook從使用者開始,使用者之間交流可以看到資訊傳播的變化。 在穀歌搜索TaiWan後,您將看到如下圖所示的知識地圖。
這個谷歌搜索結果基於現有的內容,進行了系統的整理。 穀歌現在處理很多“人物”、“地點”、“事件”、“公司”、“學校”、“電影”、“國家”等,但還是以英語內容為主。
這個“知識地圖”的推廣是穀歌想要整理全世界知識的實現,最終目的不是給出搜索結果列表,而是給出“答案”。 從最近穀歌新任工程總監Ray Kurzweil的上任可以看出,穀歌想把穀歌大神進一步“Watson”,只要問一個問題,他就會給你最正確的答案。
“Watson”是IBM構建的具有人工智慧的機器人,曾在美國智力節目中打敗人類參與者並獲得冠軍。
“社交地圖”是人們通過互動傳遞資訊,Facebook真正想的是給人們答案,使用者“不應該購買! 手機s? “現在很多人提議應該買,但你可能會說不值得再買一個答案。 但是,我相信如果使用者的交互物件真的知道該使用者的朋友,就能得到更準確更好的答案。 那麼為什麼這些結構會影響搜索結果呢?如果沒有上述電影標記、社交網路、人物標記,搜尋引擎不可能知道這部電影的詳細情況,也不知道推薦這部電影的人是誰。 當然,不能正確處理這一頁。 但是,在所有標記都很清楚的情況下,搜尋引擎不需要推測,只需要在每個步驟中取出相關標記,就可以準確地把握消息。
0 Comments