在线观看无遮挡 I 麻豆视频在线观看免费 I 免费在线播放毛片 I 57pao国产精品一区 I 欧美亚洲综合久久 I 雪臀抽搐求饶娇喘呻吟 I 麻豆香蕉 I 成人黄色免费网址 I 天堂av社区 I 欧美亚洲三级 I 日韩高清网站 I 蜜桃麻豆视频 I 午夜成人免费视频 I 玖玖爱av I 男男gay纯打屁股网站 I www.久久av I 国产av无码专区亚洲av I 日韩久久网 I 一级性生活毛片 I 91看片黄 I 四川一级毛毛片 I 精品国产人成亚洲区 I 天堂久久伊人 I 色青青草 I 黄色av男人的天堂 I 中文字幕在线播放2 I 欧美日aaa I 女生裸体视频网站免费观看 I 欧美一区二区三区…… I 日本手机在线视频 I 中出人妻中文字幕无码 I 欧美成人xxxxx I aa视频在线免费观看 I 国产丰满 I 欧美人与动牲交大全免费 I 久久99亚洲精品久久 I 久久99er6热线精品首页 I 久久久少妇高潮久久久久 I 国产精品成人午夜电影

解析google和百度兩個關鍵詞的相關度

古柏廣告設計
助力企業品牌成長
圍觀:1458次

通常對于文本信息之間得相關性得計算都是采用向量的辦法,我在以前的PPT里曾經提到過。然而對于文本信息更深層次的分析不能單純從字面上分析一篇文章的關鍵詞,更重要的是它隱含的擴展的意義。

傳統的關于計算文本相關度和【網頁和查詢的相關性】的計算都是采用匹配的方式進行的,然而這只能是基于字面意義上的統計計算。這里介紹的做法是采用關鍵詞相關性擴展的做法從而得到更加精確的相關度計算。

例子:
文章 A: 談論的是大學教育,最高頻的關鍵詞是:學生[3],學習[2],大學[2]
文章 B: 談論的是普通教育,最高頻的關鍵詞是:教育[5],教師[1],進修[1]
[]里是相對的權重,可以理解成 TF*IDF

根據傳統的相關性計算,我們會得到如下的結果:

1. 文章A 與 文章B 不相關
2. 查詢 學生,學習,大學只能返回文章A,不能返回文章B
3. 查詢 教育,教師,進修只能返回文章B,不能返回文章A

分析:
這個顯然是有一定的問題的,問題的出現在于我們通常將“字面”的意思做為分析的來源而且依靠和僅僅依靠這些“字面”的關鍵詞做為文章相關性和查詢相關性判斷的唯一要素。

如何避免?
我在以前的文章中提到過【關鍵詞相關度】的概念,舉例說明:
當出現:{學習}這個詞匯的時候,真實的表達的意義往往是這樣的:
{W1*學習,W2*教育,W3*教師,W4*大學。。。。。。}
其中W1,W2...是學習和相關詞匯的相關權重。

基于這樣一個矩陣,我們就能夠將一個詞擴展成為一組詞匯,因而也同時可以將文章所對應的向量擴展成一個更多詞匯的集合。

這里的計算需廣州網站設計要一個完整的相關度矩陣:M

M(i,j) = {關鍵詞i,j的相關度}
而兩篇文章的相關度的計算,也由簡單的
R= Sigma Vi*Vi
變為
R= Sigma Vi*M(i,j)*Vj

查詢關鍵詞和文章的相關度也由簡單的
R(i)=TF(i)*IDF(i)
變為
R(i)=Sigma TF(j)*IDF(j)*M(i,j)


下面碰到一個核心問題就是:關鍵詞之間的相關度如何計算?
例如:學校和學生的相關度是多少?
計算方法:
假設一個文章集合 {C},總文章數目為N,其中含有單詞A的文章總數為Na,含有單詞B的文章總數是Nb,含有{A+B}的文章總數是 Nab,那么相關性這么計算

CorrAB= Nab/(Na+Nb-Nab)-(Na*Nb)/(N*N)

本計算中可能會得到負相關,如果考慮到Na,Nb都是小量,可以忽略,那么

CorrAB= Nab/(Na+Nb-Nab)

至此,要計算相關度之間的全部要素都獲得了。

思考,那么到底 學校 和學生 之間的相關度是多少呢?
我們利用google來回答這個問題吧:

約有91,700,000項符合學校的查詢結果
約有88,200,000項符合學生的查詢結果
約有48,900,000項符合學廣州網站設計生 學校的查詢結果

Corr{學校,學生}=48,900,000/(91,700,000+88,200,000-48,900,000)=0.37

這個原理我以前應用在了計算【網頁信噪比】上,和網頁信噪比一起成為衡量一個網頁的關鍵詞的核心算法。
這也就是為什么6e的網頁信噪比能夠不依靠網頁上現有的關鍵詞而準確的判斷網頁的分類和相關度,是因為除了TF和IDF之外,我們能夠從已有的文本集合里學到更多的“知識”。

那么百度和google的相關度應該不難計算了:

利用 google計算得到:2,950,000/(61,800,000+6,370,000-2,950,000)=0.03

利用 baidu計算得到:2,760,000/(21,700,000+12,200,000-2,760,000)=0.08

看來基本上相關度小于10%。

版權聲明:以上文章信息來源于網絡,等僅代表原作者本人的觀點。除了已經標注原創的文章外,其它文章版權和文責屬于原作者。文章中出現的商標、專利和其他版權所有的信息,其版權屬于其合法持有人。對可以提供充分證據的侵權信息, 我們將在確認后的1小時內刪除。


本網站之聲明以及其修改權、更新權和最終解釋權均屬廣州古柏廣告策劃有限公司所有。

(注:古柏廣告-版權所有-轉載請注明出處。)

關鍵詞: 返回上層
品牌全案策劃、設計、執行一站式服務,
助力企業品牌成長!

掃一掃關注古柏

GOOBAI AD.

Brand Whole Case Design


4000-882-993

m.wnsjj.cn

微信加好友咨詢


廣州古柏廣告策劃有限公司

地址:廣州市天河區東圃長盛商務大廈B213-215

Copyright?2004-2025 GOOBAI Inc.All rights reserved

粵公網安備: 44010602001481號

備案號:粵ICP備09222445號

GOOBAIAD

服務熱線:136-3149-2728

業務總監:136-3149-2728(Mr.羅)

Q Q/微信:212210324

與古柏對話

關注古柏


主站蜘蛛池模板: 强奷漂亮少妇高潮伦理 | 69综合网| 人人人妻人人澡人人爽欧美一区 | 91久久国产精品视频 | 亚洲小少妇 | 一级片免费在线看 | 网曝91综合精品门事件在线 | 任你干精品 | 无遮挡1000部拍拍拍免费 | 无码一区二区三区老色鬼 | 久久国产福利一区二区 | 国产亚洲自拍av | 成 人 社区在线视频 | 色婷婷亚洲 | 国产91原创 | 黄色录像欧美 | 久久人妻精品白浆国产 | 五月色夜婷婷丁香琪琪 | 欧美品无码一区二区三区在线蜜桃 | 日本免费黄视频 | 欧美一区二区三区的 | 麻豆ā片免费观看在线看 | 国产免费专区 | 成人欧美精品 | 国产精品成人无码a片在线看 | 欧美国产日韩a欧美在线观看 | 欧美熟妇色ⅹxxx欧美妇 | 国产精品久久久久久久久li | 最新色国产精品精品视频 | 亚洲一区二区三区a | 全部露出来毛走秀福利视频 | 久久成人福利视频 | 五月天激情视频 | 成在人线av无码免费看网站 | 色爽黄1000部免费软件下载 | 日批视屏 | 日本精品免费视频 | 日韩精品无码免费一区二区三区 | 亚洲国产精品成人va在线观看 | 香港三级韩国三级日本三级 | 青青草华人在线 | 天天插天天狠天天透 | 特黄aaaaaaaaa毛片免费视频 | 精品一区国产vr | 婷婷综合在线 | 亚洲夜夜性无码国产盗摄 | 一区二区三区国产精品保安 | 五月天免费网站 | 亚洲精品国产精品国自产 | 69国产成人精品二区 | 丰满少妇被猛烈进入无码 | 国产精品久久久久久爽爽爽 | 69综合精品国产二区无码 | 自慰系列无码专区 | 在线天堂www在线资源下载 | 九九久久99 | 亚洲va韩国va欧美va精四季 | 人人干人人澡 | 美女网站av| 手机看片毛片 | 伊人网在线播放 | 久久www免费人成看片入口 | 亚洲愉拍99热成人精品热久久 | 激情在线视频 | 午夜亚洲国产理论片二级港台二级 | 欧美浮力影院 | 国产福利在线观看 | 牛牛免费在线视频 | 九九啪啪 | 19禁国产精品福利视频 | 日本精品免费在线观看 | 久操国产 | 国产在线拍偷自揄拍精品 | 亚洲国产精品福利片在线观看 | 欧美极度丰满熟妇hd | 亚洲国产中文在线 | 国产一区二区中文字幕 | 亚洲一区精品二人人爽久久 | 成年女人午夜毛片免费视频 | 吃奶摸下的激烈视频 | 一本加勒比hezyo无码人妻 | 西川ゆい 痴汉在线播放 | 国产无遮挡又黄又爽不要vip软件 | 国产精品午夜在线 | 亚洲干综合 | 国产乱子伦在线观看 | av中文天堂在线 | 无遮挡粉嫩小泬久久久久久久 | 五月天婷婷在线观看 | 国产美女网 | av中文在线播放 | 欧美一级在线免费观看 | 成人免费午夜视频 | 无翼乌工口肉肉无遮挡无码18 | 女人被躁到高潮免费视频软件 | 亚洲国产综合无码一区二区bt下 | 交换国产精品视频一区 | 亚洲欧洲精品一区二区三区 | 日日操夜夜干 |