在线观看无遮挡 I 麻豆视频在线观看免费 I 免费在线播放毛片 I 57pao国产精品一区 I 欧美亚洲综合久久 I 雪臀抽搐求饶娇喘呻吟 I 麻豆香蕉 I 成人黄色免费网址 I 天堂av社区 I 欧美亚洲三级 I 日韩高清网站 I 蜜桃麻豆视频 I 午夜成人免费视频 I 玖玖爱av I 男男gay纯打屁股网站 I www.久久av I 国产av无码专区亚洲av I 日韩久久网 I 一级性生活毛片 I 91看片黄 I 四川一级毛毛片 I 精品国产人成亚洲区 I 天堂久久伊人 I 色青青草 I 黄色av男人的天堂 I 中文字幕在线播放2 I 欧美日aaa I 女生裸体视频网站免费观看 I 欧美一区二区三区…… I 日本手机在线视频 I 中出人妻中文字幕无码 I 欧美成人xxxxx I aa视频在线免费观看 I 国产丰满 I 欧美人与动牲交大全免费 I 久久99亚洲精品久久 I 久久99er6热线精品首页 I 久久久少妇高潮久久久久 I 国产精品成人午夜电影

解析google和百度兩個關鍵詞的相關度

古柏廣告設計
助力企業品牌成長
圍觀:1458次

通常對于文本信息之間得相關性得計算都是采用向量的辦法,我在以前的PPT里曾經提到過。然而對于文本信息更深層次的分析不能單純從字面上分析一篇文章的關鍵詞,更重要的是它隱含的擴展的意義。

傳統的關于計算文本相關度和【網頁和查詢的相關性】的計算都是采用匹配的方式進行的,然而這只能是基于字面意義上的統計計算。這里介紹的做法是采用關鍵詞相關性擴展的做法從而得到更加精確的相關度計算。

例子:
文章 A: 談論的是大學教育,最高頻的關鍵詞是:學生[3],學習[2],大學[2]
文章 B: 談論的是普通教育,最高頻的關鍵詞是:教育[5],教師[1],進修[1]
[]里是相對的權重,可以理解成 TF*IDF

根據傳統的相關性計算,我們會得到如下的結果:

1. 文章A 與 文章B 不相關
2. 查詢 學生,學習,大學只能返回文章A,不能返回文章B
3. 查詢 教育,教師,進修只能返回文章B,不能返回文章A

分析:
這個顯然是有一定的問題的,問題的出現在于我們通常將“字面”的意思做為分析的來源而且依靠和僅僅依靠這些“字面”的關鍵詞做為文章相關性和查詢相關性判斷的唯一要素。

如何避免?
我在以前的文章中提到過【關鍵詞相關度】的概念,舉例說明:
當出現:{學習}這個詞匯的時候,真實的表達的意義往往是這樣的:
{W1*學習,W2*教育,W3*教師,W4*大學。。。。。。}
其中W1,W2...是學習和相關詞匯的相關權重。

基于這樣一個矩陣,我們就能夠將一個詞擴展成為一組詞匯,因而也同時可以將文章所對應的向量擴展成一個更多詞匯的集合。

這里的計算需廣州網站設計要一個完整的相關度矩陣:M

M(i,j) = {關鍵詞i,j的相關度}
而兩篇文章的相關度的計算,也由簡單的
R= Sigma Vi*Vi
變為
R= Sigma Vi*M(i,j)*Vj

查詢關鍵詞和文章的相關度也由簡單的
R(i)=TF(i)*IDF(i)
變為
R(i)=Sigma TF(j)*IDF(j)*M(i,j)


下面碰到一個核心問題就是:關鍵詞之間的相關度如何計算?
例如:學校和學生的相關度是多少?
計算方法:
假設一個文章集合 {C},總文章數目為N,其中含有單詞A的文章總數為Na,含有單詞B的文章總數是Nb,含有{A+B}的文章總數是 Nab,那么相關性這么計算

CorrAB= Nab/(Na+Nb-Nab)-(Na*Nb)/(N*N)

本計算中可能會得到負相關,如果考慮到Na,Nb都是小量,可以忽略,那么

CorrAB= Nab/(Na+Nb-Nab)

至此,要計算相關度之間的全部要素都獲得了。

思考,那么到底 學校 和學生 之間的相關度是多少呢?
我們利用google來回答這個問題吧:

約有91,700,000項符合學校的查詢結果
約有88,200,000項符合學生的查詢結果
約有48,900,000項符合學廣州網站設計生 學校的查詢結果

Corr{學校,學生}=48,900,000/(91,700,000+88,200,000-48,900,000)=0.37

這個原理我以前應用在了計算【網頁信噪比】上,和網頁信噪比一起成為衡量一個網頁的關鍵詞的核心算法。
這也就是為什么6e的網頁信噪比能夠不依靠網頁上現有的關鍵詞而準確的判斷網頁的分類和相關度,是因為除了TF和IDF之外,我們能夠從已有的文本集合里學到更多的“知識”。

那么百度和google的相關度應該不難計算了:

利用 google計算得到:2,950,000/(61,800,000+6,370,000-2,950,000)=0.03

利用 baidu計算得到:2,760,000/(21,700,000+12,200,000-2,760,000)=0.08

看來基本上相關度小于10%。

版權聲明:以上文章信息來源于網絡,等僅代表原作者本人的觀點。除了已經標注原創的文章外,其它文章版權和文責屬于原作者。文章中出現的商標、專利和其他版權所有的信息,其版權屬于其合法持有人。對可以提供充分證據的侵權信息, 我們將在確認后的1小時內刪除。


本網站之聲明以及其修改權、更新權和最終解釋權均屬廣州古柏廣告策劃有限公司所有。

(注:古柏廣告-版權所有-轉載請注明出處。)

關鍵詞: 返回上層
品牌全案策劃、設計、執行一站式服務,
助力企業品牌成長!

掃一掃關注古柏

GOOBAI AD.

Brand Whole Case Design


4000-882-993

m.wnsjj.cn

微信加好友咨詢


廣州古柏廣告策劃有限公司

地址:廣州市天河區東圃長盛商務大廈B213-215

Copyright?2004-2025 GOOBAI Inc.All rights reserved

粵公網安備: 44010602001481號

備案號:粵ICP備09222445號

GOOBAIAD

服務熱線:136-3149-2728

業務總監:136-3149-2728(Mr.羅)

Q Q/微信:212210324

與古柏對話

關注古柏


主站蜘蛛池模板: 夜夜高潮夜夜爽夜夜爱爱一区 | 粗大猛烈进出高潮视频大全 | 在线日韩av免费永久观看 | 日韩女女同一区二区三区 | 国产极品91| 亚洲国产精品日本无码网站 | 牛牛在线视频 | 国产午夜亚洲精品 | 色婷婷综合视频 | 国产精品无码不卡一区二区三区 | 久久99精品久久久久免费 | 国产伦一区二区三区四区 | 无码视频免费一区二区三区 | 人妻少妇乱孑伦无码专区蜜柚 | 无码毛片一区二区本码视频 | 天天躁狠狠躁狠狠躁夜夜躁68 | 人人爽人人澡人人人妻、百度 | 日韩人妻ol丝袜av一二区 | 天天看片中文字幕 | 欧美综合色网 | 久操欧美 | 亚洲天堂日本 | 可以看三级的网站 | 久久天天躁狠狠躁夜夜免费观看 | 色偷偷狠狠色综合网 | 国产男女猛烈无遮挡免费视频动漫 | 狠狠噜狠狠狠狠丁香五月 | 欧美日韩在线视频一区二区 | 国产熟妇久久777777 | 青青草99久久精品国产综合 | 清清草免费视频 | 黄www在线观看 | 成人亚洲欧美一区二区三区 | 亚洲欧美中文日韩在线v日本 | 国产无遮挡裸体免费久久 | 久久精品亚 | 丰满人妻一区二区三区视频53 | 亚洲中文字幕伊人久久无码 | 91亚洲综合 | 国产欧美一区二区三区视频 | 伊人色在线视频 | 亚洲日韩精品一区二区三区无码 | 小说区 图片区色 综合区 | 国产欧美一区二区三区在线老狼 | 少妇精品久久久久久久久久 | fc2最新成人免费共享视频 | 日出水了特别黄的视频 | 四虎成人影 | 蜜臀av久久国产午夜福利软件 | 亚洲精品久久国产高清情趣图文 | 亚洲综合成人专区片 | 成人www | 汤唯的三级av在线播放 | 国产极品久久久久极品 | 无码骚夜夜精品 | 太平公主秘史在线观看免费 | 亚洲成a人蜜臀av在线播放 | 在线观看精品91福利 | 人妻 日韩精品 中文字幕 | 伊人春色网站 | 精品一区二区三区影院在线午夜 | 青青草国产精品 | 啦啦啦www在线观看免费视频 | 黑人一级大毛片 | 欧美综合乱图图区乱图图区 | 九九九九热精品免费视频点播观看 | 国产精品丝袜黑色高跟鞋v18 | 女人爽到高潮潮喷18禁网站 | 丁香五月天综合缴情网 | 亚洲网站在线播放 | 一本加勒比hezyo东京图库 | 日韩一卡二卡三卡四卡免费观在线 | 精品国产精品 | 日本簧片在线观看 | 久久欧美一区二区三区 | 五月婷婷激情久久 | 亚洲欧美色图在线 | 国产91久久婷婷一区二区 | 国内精品视频自在一区 | 胖女人毛片 | 亚洲精品成人网站在线观看 | 亚洲一区二区三区自拍天堂 | 天天爱天天草 | 黄色大片一区二区三区 | 色鬼综合网 | 全部免费毛片在线播放一个 | 欧美另类图区清纯亚洲 | 色综合99久久久无码国产精品 | 国产人妻丰满熟妇嗷嗷叫 | 人人揉人人捏人人添 | 国产12页| 欧美人与禽性猛交狂配 | 日韩欧美卡一卡二卡新区 | www国产精品人妻一二三区 | 欧美老熟妇喷水 | 岛国av免费 | 日本高清视频一区二区三区 | 日本免费最新高清不卡视频 | 人人干人人爱 |