服務項目
聯系方式
保定市遨游計算機服務有限公司
咨詢熱線:13313028229
售后:0312-6791400
售后:0312-6791126
網址:www.kmdpfzbhw.com
地址:保定朝陽大街國貿大廈8樓808室
咨詢熱線:13313028229
售后:0312-6791400
售后:0312-6791126
網址:www.kmdpfzbhw.com
地址:保定朝陽大街國貿大廈8樓808室
【網站優化】搜索引擎為什么要重視原創信息?
[來源:www.kmdpfzbhw.com]
[作者:網站建設]
[日期:15-08-31]
[瀏覽次數:]
一、搜索引擎對原創的態度
1采集泛濫化
來自百度的一項調查顯示,超過80%的新聞和資訊等都在被人工轉載或機器采集,從傳統媒體的報紙到娛樂網站花邊消息、從游戲攻略到產品評測,甚至高校圖書館發的催還通知都有站點在做機器采集。
可以說,優質原創內容是被包圍在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艱難又具有挑戰性的事情。
2 提高搜索用戶體驗
數字化降低了傳播成本,工具化降低了采集成本,機器采集行為混淆內容來源降低內容質量。
采集過程中,出于無意或有意,導致采集網頁內容殘缺不全,格式錯亂或附加垃圾等問題層出不窮,這已經嚴重影響了搜索結果的質量和用戶體驗。
搜索引擎重視原創的根本原因是為了提高用戶體驗,這里講的原創為優質原創內容。
3 鼓勵原創作者和文章
轉載和采集,分流了優質原創站點的流量,不再具屬原創作者的名稱,會直接影響到優質原創站長和作者的收益。長期看會影響原創者的積極性,不利于創新,不利于新的優質內容產生。
鼓勵優質原創,鼓勵創新,給予原創站點和作者合理的流量,從而促進互聯網內容的繁榮,理應是搜索引擎的一個重要任務。
二、采集很狡詐,識別原創很艱難
1 采集冒充原創,篡改關鍵信息
當前,大量的網站批量采集原創內容后,用人工或機器的方法,篡改作者、發布時間和來源等關鍵信息,冒充原創。此類冒充原創是需要搜索引擎識別出來予以適當調整的。
2 內容生成器,制造偽原創
利用自動文章生成器等工具,“獨創”一篇文章,然后安一個吸引眼球的title,現在的成本也低得很,而且一定具有獨創性。
然而,原創是要具有社會共識價值的,而不是胡亂制造一篇根本不通的垃圾就能算做有價值的優質原創內容。內容雖然獨特,但是不具社會共識價值,此類偽原創是搜索引擎需要重點識別出來并予以打擊的。
3 網頁差異化,結構化信息提取困難
不同的站點結構化差異比較大,html標簽的含義和分布也不同,因此提取關鍵信息如標題、作者和時間的難易程度差別也比較大。
做到既提得全,又提得準,還要最及時,在當前的中文互聯網規模下實屬不易,這部分將需要搜索引擎與站長配合好才會更順暢的運行,站長們如果用更清晰的結構告知搜索引擎網頁的布局,將使搜索引擎高效地提取原創相關的信息。
下一頁:如何優化網站賬戶關鍵詞的質量度?